国产1级片-国产1级毛片-国产18在线-国产1-日韩欧美偷拍-日韩欧美天堂

Menu

江蘇Nginx反爬蟲: 禁止惡意UserAgent抓取網站

網站建設 錄入時間 2023-08-05 閱讀次數 無雙建站
反爬蟲常見方法

    1. 根據 IP 訪問頻率封禁 IP

    2. 設置賬號登陸時長,賬號訪問過多封禁
    設置賬號的登錄限制,只有登錄才能展現內容
    設置賬號登錄的時長,時間一到則自動退出

    3. 彈出數字驗證碼和圖片確認驗證碼
    爬蟲訪問次數過多,彈出驗證碼要求輸入

    4. 對 API 接口的限制
    每天限制一個登錄賬戶后端 api 接口的調用次數
    對后臺 api 返回信息進行加密處理

nginx反爬設置

    站點配置文件

    因為user-agent帶有Bytespider爬蟲標記,這可以通過Nginx規則來限定流氓爬蟲的訪問,直接返回403錯誤。
    修改對應站點配置文件(注意是在server里面)

    添加紅色部分

    server {
      listen 80 default_server;
      listen [::]:80 default_server;
      index index.html index.htm index.nginx-debian.html;
      server_name _;
      location / {
        try_files $uri $uri/ =404;
      }
      #forbidden Scrapy
      if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) {
        return 403;
      }
      #forbidden UA
      if ($http_user_agent ~ "Bytespider|FeedDemon|JikeSpider|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|python-requests|lightDeckReports Bot|YYSpider|DigExt|YisouSpider|HttpClient|MJ12bot|heritrix|EasouSpider|Ezooms|^$" ) {
        return 403;
      }
      #forbidden not GET|HEAD|POST method access
      if ($request_method !~ ^(GET|HEAD|POST)$) {
        return 403;
      }
    }

    附錄:UA收集

    FeedDemon             內容采集
    BOT/0.1 (BOT for JCE) sql注入
    CrawlDaddy            sql注入
    Java                  內容采集
    Jullo                 內容采集
    Feedly                內容采集
    UniversalFeedParser   內容采集
    ApacheBench           cc攻擊器
    Swiftbot              無用爬蟲
    YandexBot             無用爬蟲
    AhrefsBot             無用爬蟲
    YisouSpider           無用爬蟲(已被UC神馬搜索收購,此蜘蛛可以放開!)
    jikeSpider            無用爬蟲
    MJ12bot               無用爬蟲
    ZmEu phpmyadmin       漏洞掃描
    WinHttp               采集cc攻擊
    EasouSpider           無用爬蟲
    HttpClient            tcp攻擊
    Microsoft URL Control 掃描
    YYSpider              無用爬蟲
    jaunty                wordpress爆破掃描器
    oBot                  無用爬蟲
    Python-urllib         內容采集
    Python-requests       內容采集
    Indy Library          掃描
    FlightDeckReports Bot 無用爬蟲
    Linguee Bot           無用爬蟲
    使用python驗證

    python驗證

    使用requests模塊

    image.png


    使用urllib模塊

    image.png


    返回403就表示起作用了。

    b'\r\n403 Forbidden\r\n\r\n

    403 Forbidden

    \r\n
    nginx
    \r\n\r\n\r\n'

    三、整站防護設置

    image.png


      層:robots.txt

      robots是網站跟爬蟲間的協議,用簡單直接的txt格式文本方式告訴對應的爬蟲被允許的權限,也就是說robots.txt是搜索引擎中訪問網站的時候要查看的個文件。

      注意:它只是做了協議規定,是否允許將爬取的數據收錄,不影響網頁訪問。

      備注:對于手動寫爬蟲技術人員而言,一般都是直接忽略掉的。

       

      如果不允許所有的爬蟲蜘蛛訪問,內容如下:

      User-agent: *
      Disallow: /

      第二層:useragent特征攔截

      因為user-agent帶有Bytespider爬蟲標記,這可以通過Nginx規則來限定流氓爬蟲的訪問,直接返回403錯誤。

      具體操作,請查看上面的nginx配置。

      備注:這樣可以防止一部分爬蟲訪問,以及初級爬蟲人員。

       

      第三層:JS發送鼠標點擊事件

      有些網站,你從瀏覽器可以打開正常的頁面,而在requests里面卻被要求輸入驗證碼或者是重定向到其他的頁面。
      原理:當點擊登錄時,觸發js加密代碼,復雜的加密算法參數+時間戳+sig值,后臺進行 參數+時間的限制。驗證成功后,才可以登錄。

       

      備注:爬蟲高手需要模擬瀏覽器行為,加載js代碼以及圖片識別,才能正常登陸。

       

      第四層:后臺接口限制

      1. 根據 IP 訪問頻率封禁 IP(注意:頻率要控制好,否則容易誤傷。)
      2. 設置賬號登陸時長,賬號訪問過多封禁。
          設置賬號的登錄限制,只有登錄才能展現內容 設置賬號登錄的時長,時間一到則自動退出
      3.彈出數字驗證碼和圖片確認驗證碼
          爬蟲訪問次數過多,前端彈出驗證碼要求輸入
      4.對 API 接口的限制
          每天的登錄賬戶,請求后端 api 接口時,做調用次數限制。對后臺 api 返回信息進行加密處理

       

      通過這4層設置,就可以有效的保護數據的安全了。

【版權聲明】:本站內容來自于與互聯網(注明原創稿件除外),供訪客免費學習需要。如文章或圖像侵犯到您的權益,請及時告知,我們第一時間刪除處理!謝謝!

無雙科技
如何獲取外貿詢盤和訂單?
網站建設咨詢:13534259410

經典客戶案例展示

熱門服務
眾多企業的選擇

深圳無雙科技 - 專注于高端網站建設、網站設計開發、品牌網站制作

咨詢電話:13534259410

售后服務:13534259410  (7×24小時)
在線 Q Q:253849310 (售前咨詢)

深圳網站建設咨詢
【掃一掃咨詢】
  • 掃一掃 在線咨詢
    無雙科技官方公眾號
  • 響應式客戶端
    掃一掃 關注好友
體驗創新服務

深圳無雙科技,專注于深圳網站建設、深圳網站設計、深圳網站制作。
服務客戶超3000家,一站式網站建設及推廣營銷解決方案提供商。
我們的價值觀:誠信、坦誠、盡責、創新。期待與您合作!

您好,很高興為您服務 ^_^
主站蜘蛛池模板: 蒙古小男孩唱哭全场| 冰雪十一天| 阿妹的诺言| shiki| 那些年,那些事 电视剧| 人民的名义电视剧免费版| 双勾函数的图像与性质| 包公决战潘金莲在线观看| 一年级歇后语下册| 韩国电影《甜性涩爱》| 浙江卫视全天节目表| 二年级上册数学竖式计算题| 女生被艹在线观看| 王同辉| 小麦进城电视剧| 溜冰圆舞曲音乐教案| 张国强个人简历| 屠夫小姐在线播放| 电影《七天》| 科室对分级护理落实情况检查记录| 女八路被鬼子抓了受刑| 蚀电影| 朴信惠电视剧| 徐情| 三年级上册修改病句专项训练| 护航电影| 刘德华练习歌词| 葛思然| 麦兆辉| 蓝家宝电影| 小野惠令奈| 秘密之门| 小强升职记| 爱欲1990未删减版播放| 情人电视剧| 中国未来会黑人化吗| 十大高蛋白食物蔬菜| 八月照相馆| 魅力先生王瀚| 女人天下150集国语版电视剧| 韩帅|