2021千古sΤ镜缡泳缑夥压劭滁/h1>

收藏︰WINDOWS批量ke)境chu)海量指定大小的文件(jian)

祥子博客用的Windows Server,博客運行(xing)幾年(nian)後(hou)產(chan)生了海量的小文件(jian)緩存內(na)容(大約有(you)400萬(wan)左右緩存文件(jian))。經(jing)測試,祥子用以下這句(ju)批量ke)境chu)指定大小(小于1K)的文件(jian),實測有(you)效︰for /r "K:\76" %i in (*) do @(if %~zi lss 1024 del /f "%i") 。

發布時間︰2021-08-02 01:31:18
標簽︰

Phthon Django框架WEB開發︰一個菜si)竦娜朊判牡/b>

花了兩個月,Python Django學習(xi)an)嬉歡溫洌 chun)粹基于python Django框架全手工(gong)開發的網站明天就(jiu)能(neng)上線了(雖然(ran)只huang)歉隼奔ν荊 Tjango web開發的nan) xi)路上xi) 裙芏囁櫻 還zhong)于完成開發了,而我的“足(zu)球粉絲(si)網”明天即將上線。

非科班出身,我自學過ASP、PHP、Python,而學習(xi)Python之(zhi)路是其中最令我有(you)滿足(zu)感,最令我快樂的nan) xi)過程。基于非常(chang)強大的庫調用,使用Django框架開發網站效率非常(chang)之(zhi)高,而數據采(cai)集模塊(kuai)更令人(ren)著迷。

Python也有(you)機會成為未來互聯網開發的大方向之(zhi)一。前車之(zhi)鑒(jian),在此(ci)分享(xiang)我在學習(xi)Python Django框架中踩過的坑和以實用的入門文檔,希(xi)望能(neng)幫到想用Django做數據采(cai)集和WEB開發的朋友(附(fu)我收藏的所(suo)有(you)實用文檔和避坑寶(bao)典)。

發布時間︰2021-08-02 01:31:58
標簽︰ python

原創︰django配置根目錄(lu)訪問靜(jing)態文件(jian)favicon.ico 返回狀態要200不要302

一般前端si)  叨疾換嵩諞avico.com放(fang)在什(shi)麼目錄(lu),是否經(jing)歷了跳轉(zhuan)。但是,對一名SEO專家yi)此(ci)擔 樽硬幌xi)望頁面(mian)請(qing)求不能(neng)有(you)任何跳轉(zhuan)。所(suo)以,就(jiu)有(you)了下面(mian)這個辦(ban)法︰Django使用HttpResponse返回圖片(pian)並(bing)顯示。這可(ke)能(neng)是django項(xiang)目把靜(jing)態文件(jian)放(fang)在根目錄(lu),能(neng)正常(chang)訪問shi) 禱00狀態的唯一方法。根目錄(lu)訪問favicon.ico並(bing)返回200狀態的使用實例︰

favicon.py:

from django.http import HttpResponse

發布時間︰2021-08-02 01:31:25
標簽︰ python

g_resources.DistributionNotFound: The pytz distribution was not found and is required by Django

最近正在學Python WEB開發,剛裝好Python,PyCharm,Django。準備入手zhong)窖 xi),在創建第一個django項(xiang)目時需要先行(xing)初始化(hua)。在輸入初始化(hua)指令時報(bao)錯︰pkg_resources.DistributionNotFound: The 'pytz' distribution was not found and is required by Django。

初始化(hua)Django項(xiang)目︰django-admin startproject HelloWorld

發布時間︰2021-08-02 01:31:56
標簽︰ python Django

一文看懂robots怎(zen)麼寫︰蜘蛛協議robots.txt寫法實例詳解

robots.txt是SEO同行(xing)們(men)在制定一個網站優化(hua)方案(an)時需要首要考慮(lv)的一個問題,任何網站進行(xing)SEO優化(hua)前,你需要首先寫一個非常(chang)規範的robots.txt。robots怎(zen)麼寫,這幾乎是你制定SEO優化(hua)方案(an)、提升你網站SEO表現最具性價比的工(gong)作,沒有(you)之(zhi)一。robots.txt是什(shi)麼?robots.txt(統(tong)一小寫)是一種存放(fang)于網站根目錄(lu)下的ASCII編碼的文本(ben)文件(jian)(其實UTF-8也沒任何問題),它通常(chang)告訴網絡搜(sou)索引擎的漫(man)游器(qi)(又稱網絡蜘蛛),此(ci)網站中的na)男├na)容是不應被(bei)搜(sou)索引擎的漫(man)游器(qi)獲取(qu)的,哪(na)些是可(ke)以被(bei)漫(man)游器(qi)獲取(qu)的。因(yin)為一些系統(tong)中的URL是大小寫敏感的,所(suo)以robots.txt的文件(jian)名應統(tong)一為小寫。robots.txt應放(fang)置于網站的根目錄(lu)下。如(ru)果想單獨(du)定義搜(sou)索引擎的漫(man)游器(qi)訪問子目錄(lu)時的行(xing)為,那麼chun)梢越 遠 納柚煤喜(xi)bing)到根目錄(lu)下的robots.txt,或者使用robots元數據(Metadata,又稱元數據)。


Robots協議

發布時間︰2021-08-02 01:31:38
標簽︰ seo robots

SEO常(chang)識︰不同HTTP返回碼搜(sou)索引擎如(ru)何處理

HTTP常(chang)見返回狀態表現在用戶端通常(chang)是網頁能(neng)打開、網不能(neng)訪問。頁反饋在搜(sou)索引擎的蜘蛛程序則會表現在具體的狀態碼,如(ru)我們(men)通常(chang)知(zhi)道lai)模00表示正常(chang)訪問、301為永久重定向、302臨時重定向、404頁面(mian)無法訪問、501服(fu)務(wu)器(qi)故障 等等qu)D敲矗 sou)索引擎蜘蛛發起訪問時,對于不同的HTTP返回狀態是如(ru)何處理呢?2xx(200訪問成功)︰HTTP 結(jie)果代碼,表示成功的“有(you)條件(jian)地允許”抓取(qu)結(jie)果。3xx(訪問被(bei)重定向)︰一般情況下,系統(tong)會跟蹤重定向,直到發現有(you)效的結(jie)果(或確認出現循(xun)環)。我們(men)會跟蹤有(you)限(xian)次數的重定向(適用于 HTTP/1.0 的 RFC 1945 最多允許 5 次重定向),然(ran)後(hou)便(bian)會停止,並(bing)將其處理為 404 錯誤(wu)。我們(men)並(bing)未定義如(ru)何處理指向禁止網址的 robots.txt 重定向,並(bing)且不建議用戶這麼做。同樣(yang),我們(men)也未定義如(ru)何根據返回 2xx 的 HTML 內(na)容處理 robots.txt 文件(jian)的邏輯(ji)重定向(框架、JavaScript 或元刷(shua)新型重定向),並(bing)且不建議用戶這麼做。

發布時間︰2021-08-02 01:31:13
標簽︰ 搜(sou)索引擎 蜘蛛

【谷歌蜘蛛名稱大全】絕對不僅僅只huang)悄闃zhi)道lai)ooglebot

正如(ru)所(suo)有(you)國內(na)SEO所(suo)知(zhi),百(bai)度蜘蛛名稱叫(jiao)作BaiduSpider,而谷歌蜘蛛名稱叫(jiao)作GoogleBot。但是不限(xian)于此(ci),谷歌不同產(chan)品的抓取(qu)UA(User-Agent)是不一樣(yang)的。可(ke)以理解為每個產(chan)品都是獨(du)立項(xiang)目在運行(xing)。當然(ran),它們(men)的名稱也可(ke)能(neng)是一樣(yang),比如(ru)谷歌PC版蜘蛛和移(yi)動端蜘蛛的名稱都是Googlebot。以下為谷歌所(suo)有(you)產(chan)品抓取(qu)工(gong)具的蜘蛛名稱(谷歌官方稱之(zhi)為︰用戶代理令牌或產(chan)品令牌)與User-Agent(完整的用戶代理字符串)。

發布時間︰2021-08-02 01:31:58
標簽︰ 搜(sou)索引擎 google 蜘蛛

PHP正則表達式匹(pi)配所(suo)有(you)中文漢字內(na)容

大多數SEO一般不會用到正則表達式,除(chu)了在為網站寫偽(wei)ben)蔡 媸薄2還 ru)果你的網站要自動處理大量內(na)容,可(ke)能(neng)最簡(jian)單正則使用尚無法滿足(zu)你的需要。今天,祥子在測試內(na)容抓取(qu)並(bing)是進行(xing)文字處理時,需要過濾(lv)所(suo)有(you)帶(dai)有(you)漢字的行(xing),所(suo)以就(jiu)有(you)了這個︰hao)?淥suo)有(you)帶(dai)有(you)中文字符的行(xing)(即有(you)漢字的行(xing) ),實測正確的正則表達式為︰(.*)[^\x00-\xff](.*)。另外幾句(ju)常(chang)用正式分享(xiang)︰

發布時間︰2021-08-02 01:31:57
標簽︰ PHP 正則表達式

SEO行(xing)業

2021千古sΤ镜缡泳缑夥压劭滁/h2>
1、語音搜(sou)索;2、品fang)拼蛟旌妥zhuan)化(hua);3、用戶體驗;4、網站安全。

SEO全國

2021千古sΤ镜缡泳缑夥压劭滁/h2>
SEO漢譯為搜(sou)索引擎優化(hua)。是一種方式︰利用搜(sou)索引擎的規則提高網站在有(you)關搜(sou)索引擎內(na)的自然(ran)排名。目的是︰為網站提供生態式的自我營銷解決(jue)方案(an),讓其在行(xing)業內(na)佔(zhan)據領先地位,獲得品fang)剖找媯EO包含站jiu)EO和站內(na)SEO兩方面(mian);為了從搜(sou)索引擎中獲得更多的免費流(liu)量,從網站結(jie)構、內(na)容建設方案(an)、用戶互動傳(chuan)播(bo)、頁面(mian)等角(jiao)度進行(xing)合理規劃(hua),還會使搜(sou)索引擎中顯示的網站相關信息對用戶來ci)蹈哂you)吸引力。

發布時間︰2021-08-02 01:31:55
標簽︰ seo

最新爬蟲漏(lou)洞研究︰利用谷歌Googlebot實現XSS攻擊

所(suo)有(you)的SEO從業者,尤其是早期谷歌尚未退(tui)出中國市場就(jiu)進入SEO行(xing)業或英文網站SEO人(ren)員可(ke)能(neng)對谷歌搜(sou)索引擎的一些特性會很了解。區別于國內(na)諸如(ru)百(bai)度qu)60等ren)sou)索引,谷歌有(you)一個非常(chang)明顯的特點︰對網頁的抓取(qu)和收錄(lu)有(you)著非常(chang)高的開放(fang)度qu)=踩ren)話︰谷歌更容易收錄(lu)你的網頁chang)﹝灰 暈EO祥子跑題了。本(ben)文探討主題是“谷歌Googlebot XSS攻擊漏(lou)洞”。而這個漏(lou)洞利用過程確實以谷歌的收錄(lu)速(su)度作為一個前提。如(ru)果谷歌跟百(bai)度ran)蚱淥sou)索引擎一樣(yang),對網頁的索引具有(you)較高的門檻,那麼網絡攻擊者或許很難(nan)利用這個漏(lou)洞並(bing)給其它用戶帶(dai)來風險。


發布時間︰2021-08-02 01:31:20
標簽︰ 2021千古sΤ镜缡泳缑夥压劭此?sou)索引擎 google

Mobile-first indexing enabled for anywebsite--英文站谷歌SEO值得擁有(you)

根據SEO祥子對谷歌搜(sou)索引擎排名算法的觀察與分析(xi),谷歌大約于2015年(nian)開始非常(chang)重視網頁在使用移(yi)動設備訪問時的用戶體驗。對于在移(yi)動設備(手機、平板電腦)上訪問用戶體驗優秀的網站,往(wang)往(wang)能(neng)輕易的獲取(qu)更好的搜(sou)索排名與谷歌搜(sou)索流(liu)量。如(ru)果有(you)一天,你的谷歌網站管理員賬戶收到一封標題為“Mobile-first indexing enabled for anywebsite”的郵件(jian)(anywebsite指你的域(yu)名),那麼恭喜(xi)你!你的網站已(yi)經(jing)獲得谷歌移(yi)動設備訪問友好性的認可(ke),你將會更容易獲量谷歌移(yi)動端的搜(sou)索流(liu)量。


發布時間︰2021-08-02 01:31:29
標簽︰ 搜(sou)索引擎 google seo 百(bai)度 移(yi)動搜(sou)索

擁抱(bao)AI︰用人(ren)工(gong)智已(yi)漸滲透(tou)數字營銷

幾年(nian)前互聯網公司對AI的認識幾乎還等于零(ling),自然(ran)不會將人(ren)工(gong)智能(neng)納入數字營銷領域(yu)。但目前,人(ren)工(gong)智能(neng)的使用正在不斷發展,並(bing)且它被(bei)用于生活的各個方面(mian),數字營銷也不例外。各種調查(cha)表明,人(ren)工(gong)智能(neng)和機器(qi)學習(xi)將是多項(xiang)創新的最關鍵平台,並(bing)為所(suo)有(you)新興(xing)技(ji)術提供動力。然(ran)而,人(ren)工(gong)智能(neng)技(ji)術已(yi)經(jing)以最意想不到的方式徹底改變了數字營銷世界。當然(ran),人(ren)工(gong)智能(neng)在營銷領域(yu)的應用才是剛剛起步而已(yi),前景將是非常(chang)廣(guang)泛。

SEO祥子整理了時下較為常(chang)見AI營銷應用,你們(men)公司有(you)沒有(you)在考慮(lv)?ke)贍na)容 -人(ren)工(gong)智能(neng)自己編寫和創建內(na)容...


發布時間︰2021-08-02 01:31:11
標簽︰ 營銷 2021千古sΤ镜缡泳缑夥压劭慈?ren)工(gong)智能(neng) AI

SEO關于內(na)容的困(kun)惑︰專注原創OR采(cai)集偽(wei)原創?

SEO業內(na)盛傳(chuan)所(suo)謂的“內(na)容為王(wang) 外鏈為皇(huang)”,這里的na)諶蕕比ran)說的是原創內(na)容。那麼,你一定會迷惑︰中文網站jiu)琶欣 耐荊 bing)沒有(you)哪(na)個網站是可(ke)以顯著(zhu)看得出是“專注提供高同量原創內(na)容”的? (當然(ran),這里還存一個問題是部分網站jing)bing)不以百(bai)度ran)蚱渚jing)搜(sou)索引擎做為主要引流(liu)渠(qu)道 。)【今天不想寫了,下次繼續,是個很有(you)意思的話題,我一定會再補(bu)充    】

發布時間︰2021-08-02 01:31:56
標簽︰ seo seo內(na)容 偽(wei)原創

百(bai)度收錄(lu)做到1818萬(wan)後(hou)︰我還在等你,百(bai)度!

最近听SEO圈內(na)盛談(tan)百(bai)度又推出某算法2.0更新上線。嗯,又“上線”,那哥的網站又該漲指標了!因(yin)為我維(wei)護的網站,一般都是盡可(ke)能(neng)按(an)照最完美lai)乃sou)索引擎為標準來策劃(hua)並(bing)執行(xing)的,而並(bing)不huang)欽?浴跋衷詰摹卑bai)度qu)Ksuo)以,要個算法升級意味著更符合完美搜(sou)索引擎規則的網站會取(qu)得更好的表現。沒錯,在這個XX算法2.0上線的第二天,哥的個人(ren)站在百(bai)度ri)境?試yuan)平台可(ke)查(cha)到索引量漲了,由之(zhi)前一直穩定的1550萬(wan)左右增長至(zhi)1753萬(wan)。同樣(yang)的套(tao)路,應該會有(you)同樣(yang)的結(jie)果︰小站在百(bai)度的收錄(lu)量在1550萬(wan)維(wei)持(chi)了近一年(nian)時間後(hou),終(zhong)于,即將大幅增長!



發布時間︰2021-08-02 01:31:05
標簽︰ 百(bai)度 網站收錄(lu)

隨筆︰網站穩定性對SEO排名還是很重要的

在深(shen)圳SEO交流(liu)群里看到多位業界高手在群里吹水,各自博客都是百(bai)度深(shen)圳SEO排名首頁的主。哥憂(you)傷的查(cha)了下,深(shen)圳SEO,祥子博客第41位!哥雖然(ran)鮮有(you)精力維(wei)護博客,平均一個月寫不了一篇(pian)文章,有(you)時發點內(na)容還是轉(zhuan)載的,但是哥曾經(jing)死守(shou) 深(shen)圳SEO 這個詞的百(bai)度首頁2-3位。為什(shi)麼排名為個呢?原因(yin)很簡(jian)單,事lv)槭欽飧鱍yang)子︰大概(gai)在2017年(nian)初,博客被(bei)一個BC平台入侵,被(bei)植入木馬病毒,網站全被(bei)改成了一些敏感的na)諶蕁Uru)前面(mian)說的博客很少(shao)維(wei)護,所(suo)以這種情況大概(gai)維(wei)持(chi)了一周左右,然(ran)後(hou)博客的排名一去不復返。

發布時間︰2021-08-02 01:31:19
標簽︰ seo

收藏︰apache設置服(fu)務(wu)器(qi)端緩存

Apache 的緩存方式有(you)兩種,一種是基于硬盤文件(jian)的緩存,由 mod_disk_cache 實現,另一種是使用內(na)存緩存,由 mod_mem_cache 實現,不過它們(men)都是依(yi)賴(lai) mod_cache 模塊(kuai)的,mod_cache 模塊(kuai)提供了一些緩存配置的指令供它們(men)使用,而 mod_file_cache 模塊(kuai)是搭配 mod_mem_cache 模塊(kuai)使用的。

1、基于硬盤文件(jian)的緩存

基于硬盤文件(jian)存儲的緩存由 mod_disk_cache 模塊(kuai)實現,先看個簡(jian)單的配置例子︰

發布時間︰2021-08-02 01:31:22
標簽︰

今天在玩Python寫的第一個程序︰Python九(jiu)九(jiu)程法表

#coding:utf-8
text=''
for i in range(1, 10):
for l in range(1,10):
if i<=l:
if i*l<10:
text = text + bytes(i) +  ' * ' + bytes(l) +  ' = ' + bytes(i * l) + '   '
else:
text = text + bytes(i) + ' * ' + bytes(l) + ' = ' + bytes(i * l) + '  '
text = text + ('\n')
print text
print 'OK'

1 * 1 = 1   1 * 2 = 2   1 * 3 = 3   1 * 4 = 4   1 * 5 = 5   1 * 6 = 6   1 * 7 = 7   1 * 8 = 8   1 * 9 = 9  

發布時間︰2021-08-02 01:31:12
標簽︰ python

PHP報(bao)錯解決(jue)︰file_get_contents(): php_network_getaddresses

今天遷移(yi)一個網站到CentOS Apache,報(bao)錯如(ru)下︰“php_network_getaddresses: getaddrinfo failed: Name or service not known-- File:”。

解決(jue)方法︰1. CentOS PING 目標網站PING不通,結(jie)果為︰“ping: unknown host zhidao.baidu.com”,可(ke)以確認xi)entOS服(fu)務(wu)器(qi)無法訪問外網;

發布時間︰2021-08-02 01:31:01
標簽︰ PHP

節省帶(dai)寬 提高服(fu)務(wu)器(qi)性能(neng)︰用Robots禁止常(chang)見非主流(liu)搜(sou)索引擎掉抓取(qu)

,user-agent:  Yahoo! Slurpdisallow: /,user-agent:  Bingbotdisallow: /,user-agent:  Msnbotdisallow: /,user-agent:  ia_archiverdisallow: /,user-agent:  YodaoBotdisallow: /,user-agent:  Iaskspiderdisallow: /,user-agent:  Yahoo!disallow: /,user-agent:  Yahoo! Slurp Chinadisallow: /,user-agent:  YisouSpiderdisallow: /,user-agent:  EasouSpiderdisallow: /,user-agent:  JikeSpiderdisallow: /,user-agent:  EtaoSpiderdisallow: /,user-agent:  YandexBotdisallow: /,user-agent:  AhrefsBotdisallow: /,user-agent:  ezooms.botdisallow: /,user-agent:  msnbot-mediadisallow: /

發布時間︰2021-08-02 01:31:55
標簽︰

2021千古sΤ镜缡泳缑夥压劭滁/h2>