千古sΤ镜缡泳缑夥压劭次鞴吸/h1>

收藏︰WINDOWS批量刪除海量指定大小的文件

祥子(zi)博客用的Windows Server,博客運行(xing)幾年後產生了海量的小文件緩存(cun)內容(rong)(大約(yue)有400萬左右(you)緩存(cun)文件)。經測試,祥子(zi)用以下這句批量刪除指定大小(小于1K)的文件,實測有xing)?or /r "K:\76" %i in (*) do @(if %~zi lss 1024 del /f "%i") 。

發(fa)布時間︰2021-08-02 01:41:18
標簽︰

Phthon Django框架WEB開發(fa)︰一個菜鳥的入門心(xin)得

花了兩(liang)個月,Python Django學習告一段落,而純粹(cui)基于python Django框架全(quan)手工(gong)開發(fa)的網站jiu)魈煬jiu)能上線了(雖然只(zhi)是個辣雞網站)。在django web開發(fa)的學習路上,踩過(guo)很多坑,不huai)沼諭瓿煽 fa)了,而我的“bai)闈蚍fen)絲網”明天即將上線。

非(fei)科班出身,我yi)匝?guo)ASP、PHP、Python,而學習Python之路是其中最令我有xin)man)足感,最令我快(kuai)樂(le)zhi)難 骯guo)程。基于非(fei)常強(qiang)大的庫調用,使用Django框架開發(fa)網站效率非(fei)常之高,而數據采集模塊更(geng)令人著(zhou)迷。

Python也有機(ji)會成為未來互聯網開發(fa)的大方向之一。前車(che)之鑒,在此分享我在學習Python Django框架中踩過(guo)的坑和(he)以yun)滌玫娜朊盼牡擔 M馨 較胗jango做數據采集和(he)WEB開發(fa)的朋友(附我收藏的所有實用文檔和(he)避坑寶典)。

發(fa)布時間︰2021-08-02 01:41:58
標簽︰ python

原(yuan)創︰django配置根目錄訪問靜態文件favicon.ico 返回狀態要200不要302

一hua)闈岸絲 fa)者都不會在意favico.com放在什麼(me)目錄,是否經歷了跳(tiao)轉。但(dan)是,對一名SEO專家yi)此擔 樽zi)不希望頁面請求不能有任何(he)跳(tiao)轉。所以,就(jiu)有了下面這個辦法︰Django使用HttpResponse返回圖片(pian)並顯yun)盡U飪贍蓯jango項目把靜態文件放在根目錄,能正(zheng)常訪問並返回200狀態的唯一方法。根目錄訪問favicon.ico並返回200狀態的使用實例︰

favicon.py:

from django.http import HttpResponse

發(fa)布時間︰2021-08-02 01:41:25
標簽︰ python

g_resources.DistributionNotFound: The pytz distribution was not found and is required by Django

最近正(zheng)在學Python WEB開發(fa),剛裝好Python,PyCharm,Django。準備入手正(zheng)式學習,在創建第一個django項目時需(xu)要先行(xing)初始化。在輸(shu)入初始化指令時報錯︰pkg_resources.DistributionNotFound: The 'pytz' distribution was not found and is required by Django。

初始化Django項目︰django-admin startproject HelloWorld

發(fa)布時間︰2021-08-02 01:41:56
標簽︰ python Django

一文看懂robots怎(zen)麼(me)寫︰蜘蛛(zhu)協議robots.txt寫法實例詳解

robots.txt是SEO同行(xing)們(men)在制定一個網站優化方案時需(xu)要首(shou)要考慮(lv)的一個問題,任何(he)網站進行(xing)SEO優化前,你需(xu)要首(shou)先寫一個非(fei)常規範的robots.txt。robots怎(zen)麼(me)寫,這幾乎是你制定SEO優化方案、提升你網站SEO表現最具性(xing)價比(bi)的工(gong)作(zuo),沒有之一。robots.txt是什麼(me)?robots.txt(統(tong)一小寫)是一種(zhong)存(cun)放于網站根目錄下的ASCII編碼的文本文件(其實UTF-8也沒任何(he)問題),它(ta)通常告訴網絡搜索引擎的漫游器(又(you)稱(chen)網絡蜘蛛(zhu)),此網站中的哪些內容(rong)是不應被(bei)搜索引擎的漫游器獲(huo)取(qu)的,哪些是qiang)梢員bei)漫游器獲(huo)取(qu)的。因為一些系(xi)統(tong)中的URL是大小寫敏感的,所以robots.txt的文件名應統(tong)一為小寫。robots.txt應放置于網站的根目錄下。如果想單(dan)獨定義搜索引擎的漫游器訪問shou)zi)目錄時的行(xing)為,那麼(me)可以將自定的設置合並到根目錄下的robots.txt,或者使用robots元數據(Metadata,又(you)稱(chen)元數據)。


Robots協議

發(fa)布時間︰2021-08-02 01:41:38
標簽︰ seo robots

SEO常識︰不同HTTP返回碼搜索引擎如何(he)處理

HTTP常見返回狀態表現在用戶(hu)端通常是網頁能打開、網不能訪問。頁反饋在搜索引擎的蜘蛛(zhu)程序則會表現在具體(ti)的狀態碼,如我們(men)通常知道lai)模00表示正(zheng)常訪問、301為永久(jiu)重(zhong)定向、302臨時重(zhong)定向、404頁面無(wu)法訪問、501服務器故(gu)障 等等qu)D敲me),搜索引擎蜘蛛(zhu)發(fa)起訪問shi)保 雜誆煌 TTP返回狀態是如何(he)處理呢?2xx(200訪問成功)︰HTTP 結果代(dai)碼,表示成功的“有條件地允(yun)許”抓取(qu)結果。3xx(訪問被(bei)重(zhong)定向)︰一hua)闈榭魷攏 xi)統(tong)會跟蹤重(zhong)定向,直到發(fa)現有xing)?慕  蛉啡銑魷盅 罰 N頤men)會跟蹤有限次(ci)數的重(zhong)定向(適(shi)用于 HTTP/1.0 的 RFC 1945 最多允(yun)許 5 次(ci)重(zhong)定向),然後便會停止,並將其處理為 404 錯誤(wu)。我們(men)並未定義如何(he)處理指向禁(jin)止網址的 robots.txt 重(zhong)定向,並且不建議用戶(hu)這麼(me)做。同樣(yang),我們(men)也未定義如何(he)根據返回 2xx 的 HTML 內容(rong)處理 robots.txt 文件的邏(luo)輯(ji)重(zhong)定向(框架、JavaScript 或元刷新(xin)型重(zhong)定向),並且不建議用戶(hu)這麼(me)做。

發(fa)布時間︰2021-08-02 01:41:13
標簽︰ 搜索引擎 蜘蛛(zhu)

【谷(gu)歌(ge)蜘蛛(zhu)名稱(chen)大全(quan)】絕對不僅僅只(zhi)是你知道lai)ooglebot

正(zheng)如所有國內SEO所知,百度(du)蜘蛛(zhu)名稱(chen)叫作(zuo)BaiduSpider,而谷(gu)歌(ge)蜘蛛(zhu)名稱(chen)叫作(zuo)GoogleBot。但(dan)是不限于此,谷(gu)歌(ge)不同產品的抓取(qu)UA(User-Agent)是不一樣(yang)的。可以理解為每個產品都是獨立(li)項目在運行(xing)。當bi)唬 ta)們(men)的名稱(chen)也可能是一樣(yang),比(bi)如谷(gu)歌(ge)PC版蜘蛛(zhu)和(he)移動(dong)端蜘蛛(zhu)的名稱(chen)都是Googlebot。以下為谷(gu)歌(ge)所有產品抓取(qu)工(gong)具的蜘蛛(zhu)名稱(chen)(谷(gu)歌(ge)官方稱(chen)之為︰用戶(hu)代(dai)理令牌(pai)或產品令牌(pai))與User-Agent(完整的用戶(hu)代(dai)理字符串(chuan))。

發(fa)布時間︰2021-08-02 01:41:58
標簽︰ 搜索引擎 google 蜘蛛(zhu)

PHP正(zheng)則表達式匹(pi)配所有中文漢字內容(rong)

大多數SEO一hua)悴換嵊玫秸zheng)則表達式,除了在為網站寫ci)本蔡 媸薄2還(huai) 綣愕耐疽 遠dong)處理大量內容(rong),可能最簡單(dan)正(zheng)則使用尚無(wu)法滿(man)足你的需(xu)要。今天,祥子(zi)在測試內容(rong)抓取(qu)並是進行(xing)文字處理時,需(xu)要過(guo)濾所有帶(dai)有漢字zhi)男xing),所以就(jiu)有了這個︰匹(pi)配所有帶(dai)有中文字符的行(xing)(即有漢字zhi)男xing) ),實測正(zheng)確的正(zheng)則表達式為︰(.*)[^\x00-\xff](.*)。另外幾句常用正(zheng)式分享︰

發(fa)布時間︰2021-08-02 01:41:57
標簽︰ PHP 千古sΤ镜缡泳缑夥压劭次鞴险?zheng)則表達式

SEO行(xing)業

千古sΤ镜缡泳缑夥压劭次鞴吸/h2>
1、語音(yin)搜索;2、品牌(pai)pin)蛟旌he)轉化;3、用戶(hu)體(ti)驗;4、網站安全(quan)。

SEO全(quan)國

千古sΤ镜缡泳缑夥压劭次鞴吸/h2>
SEO漢譯(yi)為搜索引擎優化。是一種(zhong)方式︰利用搜索引擎的規則提高網站在有關(guan)搜索引擎內的自然排(pai)名。目的是︰he) 咎 gong)生態式的自我營銷解決方案,讓(rang)其在行(xing)業內佔(zhan)據領先地位,獲(huo)得品牌(pai)收益;SEO包含站jiu)EO和(he)站內SEO兩(liang)方面;為了從搜索引擎中獲(huo)得更(geng)多的免費(fei)流(liu)量,從網站結構、內容(rong)建設方案、用戶(hu)互動(dong)傳播、頁面等角度(du)進行(xing)合理規劃,還(huai)會使gu)閹饕嬤邢允(yun)鏡耐鞠喙guan)信息對用戶(hu)來說更(geng)具有吸(xi)引力。

發(fa)布時間︰2021-08-02 01:41:55
標簽︰ seo

最新(xin)爬蟲漏洞研究︰利用谷(gu)歌(ge)Googlebot實現XSS攻(gong)擊

所有的SEO從you)嫡擼 you)其是早期谷(gu)歌(ge)尚未退出中國市場(chang)就(jiu)進入SEO行(xing)業或英文網站SEO人員可能對谷(gu)歌(ge)搜索引擎的一些特性(xing)會很了解。區別于國內諸如百度(du)qu)60等搜索引,谷(gu)歌(ge)有一個非(fei)常明顯的特點︰對網頁che)淖?qu)和(he)收錄有著(zhou)非(fei)常高的開放度(du)qu)=踩嘶hua)︰谷(gu)歌(ge)更(geng)容(rong)易(yi)收錄你的網頁!不要以為SEO祥子(zi)跑題了。本文探討zhong)zhu)題是“谷(gu)歌(ge)Googlebot XSS攻(gong)擊漏洞”。而這個漏洞利用過(guo)程確實以谷(gu)歌(ge)的收錄速度(du)作(zuo)為一個前提。如果谷(gu)歌(ge)跟百度(du)或其它(ta)搜索引擎一樣(yang),對網頁che)乃饕哂薪細叩拿偶鰨 敲me)網絡攻(gong)擊者或許很難利用這個漏洞並給其它(ta)用戶(hu)帶(dai)來風險。


發(fa)布時間︰2021-08-02 01:41:20
標簽︰ 搜索引擎 google

Mobile-first indexing enabled for anywebsite--英文站谷(gu)歌(ge)SEO值(zhi)得擁有

根據SEO祥子(zi)對谷(gu)歌(ge)搜索引擎排(pai)名算法的觀察與分析,谷(gu)歌(ge)大約(yue)于2015年開始非(fei)常重(zhong)視網頁在使用移動(dong)設備訪問shi)鋇撓沒hu)體(ti)驗。對于在移動(dong)設備(手zhi)ji)、平板電腦)上訪問用戶(hu)體(ti)驗優秀的網站,往往能輕易(yi)的獲(huo)取(qu)更(geng)好的搜索排(pai)名與谷(gu)歌(ge)搜索流(liu)量。如果有一天,你的谷(gu)歌(ge)網站管(guan)理員賬戶(hu)收到一封(feng)標題為“Mobile-first indexing enabled for anywebsite”的郵件(anywebsite指你的域名),那麼(me)恭喜你!你的網站已經獲(huo)得谷(gu)歌(ge)移動(dong)設備訪問友好性(xing)的認可,你將會更(geng)容(rong)易(yi)獲(huo)量谷(gu)歌(ge)移動(dong)端的搜索流(liu)量。


發(fa)布時間︰2021-08-02 01:41:29
標簽︰ 搜索引擎 google seo 百度(du) 移動(dong)搜索

擁抱AI︰用人工(gong)智(zhi)已漸滲透數字營銷

幾年前互聯網公司(si)對AI的認xian)都負躉huai)等于零,自然不會將人工(gong)智(zhi)能納入數字營銷領域。但(dan)目前,人工(gong)智(zhi)能的使用正(zheng)在不斷發(fa)展,並且它(ta)被(bei)用于生活的各(ge)個方面,數字營銷也不例外。各(ge)種(zhong)zhi)韃楸礱鰨 斯gong)智(zhi)能和(he)機(ji)器學習將是多項創新(xin)的最關(guan)鍵(jian)平台,並為所有xing)xin)興si)際跆 gong)動(dong)力。然而,人工(gong)智(zhi)能技術已經以最意想不到的方式徹底改變了數字營銷世界(jie)。當bi)唬 斯gong)智(zhi)能在營銷領域的應用才是剛剛起步而已,前景將是非(fei)常廣泛(fan)。

SEO祥子(zi)整理了時下較為常見AI營銷應用,你們(men)公司(si)有沒有xing)誑悸lv)?生成內容(rong) -人工(gong)智(zhi)能自yue)罕嘈春he)創建內容(rong)...


發(fa)布時間︰2021-08-02 01:41:11
標簽︰ 營銷 人工(gong)智(zhi)能 AI

SEO關(guan)于內容(rong)的困惑︰專注原(yuan)創OR采集偽原(yuan)創?

SEO業內盛傳所謂的“內容(rong)為王 外鏈ci) 省保 飫 哪諶rong)當bi)凰檔氖竊yuan)創內容(rong)。那麼(me),你一定會迷惑︰中文網站排(pai)名中里的網站,並沒有xin)母 臼強(qiang)梢韻災zhu)看得出是“bai)ㄗ? gong)高同量原(yuan)創內容(rong)”的? (當bi)唬 飫 huai)存(cun)一個問題是部分網站並不以百度(du)或其經搜索引擎做為主(zhu)要引流(liu)渠道 。)【今天不想寫了,下次(ci)繼(ji)續,是個很有意思(si)的話(hua)題,我一定會再補充    】

發(fa)布時間︰2021-08-02 01:41:56
標簽︰ seo seo內容(rong) 偽原(yuan)創

百度(du)ren)章甲齙818萬後︰he)一huai)在等你,百度(du)!

最近听SEO圈內盛談百度(du)又(you)推出某算法2.0更(geng)新(xin)上線。嗯,又(you)“上線”,那哥的網站又(you)該漲指標了!因為我維護的網站,一hua)愣際薔】贍馨湊兆鍆昝賴(lai)乃閹饕嫖 曜祭床   蔥xing)的,而並不是針(zhen)對“現在的”百度(du)qu)K裕  鏊惴ㄉ兌 蹲zhou)更(geng)符合完美搜索引擎規則的網站會取(qu)得更(geng)好的表現。沒錯,在這個XX算法2.0上線的第二天,哥的個人站在百度(du)站長(chang)資源平台可查到索引量漲了,由(you)之前一直穩定的1550萬左右(you)增長(chang)至1753萬。同樣(yang)的套路,應該會有同樣(yang)的結果︰小站在百度(du)的收錄量在1550萬維持了近一年時間後,終于,即將大幅增長(chang)!



發(fa)布時間︰2021-08-02 01:41:05
標簽︰ 百度(du) 網站收錄

隨筆︰he)疚榷ㄐxing)對SEO排(pai)名還(huai)gu)嗆苤zhong)要的

在深圳SEO交流(liu)群里看到多位業界(jie)高手在群里吹水,各(ge)自博客都是百度(du)深圳SEO排(pai)名首(shou)頁che)鬧zhu)。哥憂(you)傷(shang)的查了下,深圳SEO,祥子(zi)博客第41位!哥雖然鮮(xian)有精力維護博客,平均一個月寫不了一篇文章,有時發(fa)點內容(rong)還(huai)gu)親 zai)的,但(dan)是哥曾經死守 深圳SEO 這個詞的百度(du)ren)滓-3位。為什麼(me)排(pai)名為個呢?原(yuan)因很簡單(dan),事lv)槭欽飧鱍yang)子(zi)︰大概在2017年初,博客被(bei)一個BC平台入侵,被(bei)植入木馬病毒,網站全(quan)被(bei)改成了一些敏感的內容(rong)。正(zheng)如前面說的博客很少維護,所以這種(zhong)zhi)榭齟蟾盼 至艘恢蘢笥you),然後博客的排(pai)名一去不復返。

發(fa)布時間︰2021-08-02 01:41:19
標簽︰ seo

收藏︰apache設置服務器端緩存(cun)

Apache 的緩存(cun)方式有兩(liang)種(zhong),一種(zhong)是基于硬盤文件的緩存(cun),由(you) mod_disk_cache 實現,另一種(zhong)是使用內存(cun)緩存(cun),由(you) mod_mem_cache 實現,不huai)ta)們(men)都是依(yi)賴(lai) mod_cache 模塊的,mod_cache 模塊提供(gong)了一些緩存(cun)配置的指令供(gong)它(ta)們(men)使用,而 mod_file_cache 模塊是搭配 mod_mem_cache 模塊使用的。

1、基于硬盤文件的緩存(cun)

基于硬盤文件存(cun)儲(chu)的緩存(cun)由(you) mod_disk_cache 模塊實現,先看個簡單(dan)的配置例子(zi)︰

發(fa)布時間︰2021-08-02 01:41:22
標簽︰

今天在玩(wan)Python寫的第一個程序︰Python九九程法表

#coding:utf-8
text=''
for i in range(1, 10):
for l in range(1,10):
if i<=l:
if i*l<10:
text = text + bytes(i) +  ' * ' + bytes(l) +  ' = ' + bytes(i * l) + '   '
else:
text = text + bytes(i) + ' * ' + bytes(l) + ' = ' + bytes(i * l) + '  '
text = text + ('\n')
print text
print 'OK'

1 * 1 = 1   1 * 2 = 2   1 * 3 = 3   1 * 4 = 4   1 * 5 = 5   1 * 6 = 6   1 * 7 = 7   1 * 8 = 8   1 * 9 = 9  

發(fa)布時間︰2021-08-02 01:41:12
標簽︰ python

PHP報錯解決︰file_get_contents(): php_network_getaddresses

今天遷移一個網站到CentOS Apache,報錯如下︰“php_network_getaddresses: getaddrinfo failed: Name or service not known-- File:”。

解決方法︰1. CentOS PING 目標網站PING不通,結果為︰“ping: unknown host zhidao.baidu.com”,可以確認,CentOS服務器無(wu)法訪問外網;

發(fa)布時間︰2021-08-02 01:41:01
標簽︰ PHP

節省帶(dai)寬 提高服務器性(xing)能︰用Robots禁(jin)止常見非(fei)主(zhu)流(liu)搜索引擎掉抓取(qu)

,user-agent:  Yahoo! Slurpdisallow: /,user-agent:  Bingbotdisallow: /,user-agent:  Msnbotdisallow: /,user-agent:  ia_archiverdisallow: /,user-agent:  YodaoBotdisallow: /,user-agent:  Iaskspiderdisallow: /,user-agent:  Yahoo!disallow: /,user-agent:  Yahoo! Slurp Chinadisallow: /,user-agent:  YisouSpiderdisallow: /,user-agent:  EasouSpiderdisallow: /,user-agent:  JikeSpiderdisallow: /,user-agent:  EtaoSpiderdisallow: /,user-agent:  YandexBotdisallow: /,user-agent:  AhrefsBotdisallow: /,user-agent:  ezooms.botdisallow: /,user-agent:  msnbot-mediadisallow: /

發(fa)布時間︰2021-08-02 01:41:55
標簽︰

千古sΤ镜缡泳缑夥压劭次鞴吸/h2>