通常,文章或網頁的發佈時間都會直接顯示在頁面上。但有時,某些網頁會試圖偽裝成永不過時的內容,這在您需要了解其相關性時會造成問題。別擔心,有一些方法可以揭開這層神秘面紗。
需要明確的是,無法保證能找到確切的日期——您可能只能估算信息的年齡。通常,這已經足夠了。
網頁地址嚴格來說就在您眼前,但卻很容易被忽略。首先檢查一下。不幸的是,這些地址並不總是前後一致或精確。一些Popular Science的舊文章的URL包含了它們的出版年份和月份(但沒有日期)。我們較新的文章則沒有。
XML網站地圖只是給定網站的URL列表,其中包含有關每個URL的基本信息。它的作用是指導搜索引擎爬蟲在其永無止境的收集數據任務中。要查看它,請前往地址欄並在頁面URL末尾添加/sitemap.xml。
如果您幸運的話,它會組織得井井有條,就像白宮網站上的那個一樣。對於更新更頻繁的網站(例如Lifehacker),您可能會得到一個包含大量上次修改日期的列表。最壞的情況是,它根本不起作用,您會得到一個404錯誤,就像PopSci一樣。
互聯網檔案的Wayback Machine是一個快照存儲庫,編目了網絡上數十億個頁面。只需將您要調查的URL粘貼到網站的搜索欄中,然後按Enter鍵。這將返回一個時間線,顯示該工具何時捕獲了相關頁面的圖像。點擊您想要的年份,然後點擊突出顯示的日曆日期之一,即可查看它當時的樣子。
對於這篇關於如何使用手機打印和掃描物品的PopSci文章,Wayback Machine上的最早日期是2017年3月14日——文章發布的那一天。雖然這是準確的,但這並不總是如此。您正在查看的頁面可能在發布後一段時間才被記錄,或者根本沒有被記錄。
有時,Google搜索結果會顯示日期。如果沒有,您可以強制搜索引擎執行此操作。複製您想知道的頁面的地址,前往搜索欄,然後鍵入inurl:。然後在冒號後粘貼URL(無空格)。這將告訴Google只顯示來自該確切網站的結果。
接下來,轉到地址欄(不是搜索欄),並在其中的URL末尾添加&as_qdr=y25。此命令告訴Google顯示過去25年的結果。 “as”代表“高級搜索”,“qdr”是“查詢日期範圍”的縮寫,“y25”表示“過去25年”。您可以更改最後一位以使用“d”表示天,“w”表示週或“m”表示月,後跟您想要的任何數字。
當您在此修改後的URL上按Enter鍵時,Google將顯示帶有搜索結果的日期。但是,與此處列出的其他選項一樣,無法保證其準確性。它可能是發佈時間、上次修改日期或Google對其進行索引的日期。例如,PopSci關於最佳披薩加熱方法的文章顯示的是2020年2月7日。那是我們第一次發布它的日期,但它在2021年2月5日進行了更新。
另一種更費時的方法來確定頁面的第一次Google出現時間是使用inurl:命令,在搜索欄下找到工具,然後點擊任何時間下拉菜單。選擇自定義範圍…並輸入一些日期。通過逐年搜索並不斷縮小日期範圍,您應該能夠找到頁面首次上線的時間,但這並不是一個高效的過程。
右鍵單擊任何網頁,您應該會看到一個查看源代碼的選項。在Google Chrome瀏覽器中,它顯示為查看頁面源代碼。選擇它,您將看到幕後的景象。在所有這些信息中,您可能能夠找到頁面的創建或修改時間。在Windows上使用Ctrl F或在macOS上使用Cmd F打開搜索功能,並儘力找到它。嘗試查找諸如“date”、“published”、“publishdate”、“modified”、“datemodified”或類似的關鍵詞。
PopSci清楚地說明了其文章的發佈時間和更新時間,但您可以通過搜索“last_updated_date”在源代碼中找到該日期。但是,請注意:頁面上其他項目(如照片)可能也包含日期。這些日期可能與其他內容的年齡不同。
這種策略之所以成為我們列表中最難的一種,是因為它存在著極大的不一致性和潛在的複雜性。如果它能很好地工作,您可以快速找到答案。如果不行,那麼您將不得不篩選大量的代碼。
以上是5個偵察技能,可以揭示任何網頁的年齡的詳細內容。更多資訊請關注PHP中文網其他相關文章!