


Detailliertes Beispiel für die Verwendung von Ruby und Nokogiri zur Simulation von Crawlern zum Exportieren von RSS-Seeds
# encoding: utf-8 require 'thread' require 'nokogiri' require 'open-uri' require 'rss/maker' $result=Queue.new def extract_readme_header(no,name,url) frame = Nokogiri::HTML(open(url)) return unless frame readme=$url+frame.css('frame')[1]['src'] return unless readme open(readme) do |f| doc = Nokogiri::HTML(f.read) text=doc.css("div#content div#filecontents p")[0..4].map { |c| c.content }.join(" ").strip return if text.length==0 if text !~ /(rails)|(activ_)/i puts "========= #{no} #{name} : #{text[0..50]}" date = f.last_modified $result << [no,name,readme,date,text] end end rescue puts $!.to_s end def make_rss(items) RSS::Maker.make("2.0") do |m| m.channel.title = "GtitHub recently updated projects" m.channel.link = "http://localhost" m.channel.description = "GitHub recently updated projects" m.items.do_sort = true items.each do |no,name,url,date,descr| i = m.items.new_item i.title = name i.link = url i.description=descr i.date = date end end end ############################## M A I N ######################## ############# Scan list of recent project lth=[] $url="http://rdoc.info" puts "get url #{$url}..." doc = Nokogiri::HTML(open($url)) doc.css('ul.libraries')[1].css('li').each_with_index do |li,i| aname =li.css('a').first name=aname.content purl=$url+aname['href'] lth << Thread.new(i,name,purl) { |j,n,u| extract_readme_header(j,n,u) } end ################ wait all readme are read lth.each { |th| th.join() } ################ dequeue results and sort them by date descending result=[] result << $result.shift while $result.size>0 result.sort! { |a,b| a[0] <=> b[0] } ################ format results in rss File.open("RubyFeeds.rss","w") do |file| file.write make_rss(result) end
Das obige ist der detaillierte Inhalt vonDetailliertes Beispiel für die Verwendung von Ruby und Nokogiri zur Simulation von Crawlern zum Exportieren von RSS-Seeds. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Wie implementiert man mit C++ ein einfaches Webcrawler-Programm? Einleitung: Das Internet ist eine Schatzkammer an Informationen, und eine große Menge nützlicher Daten kann über Webcrawler problemlos aus dem Internet abgerufen werden. In diesem Artikel wird erläutert, wie Sie mit C++ ein einfaches Webcrawler-Programm schreiben, sowie einige allgemeine Tipps und Vorsichtsmaßnahmen. 1. Vorbereitung zur Installation eines C++-Compilers: Zuerst müssen Sie einen C++-Compiler auf Ihrem Computer installieren, z. B. gcc oder clang. Sie können „g++-v“ oder „clang“ über die Befehlszeile eingeben

So verwenden Sie PHP und XML zur Implementierung der RSS-Abonnementverwaltung und -anzeige auf einer Website. RSS (Really Simple Syndication) ist ein Standardformat für die Veröffentlichung häufig aktualisierter Blogbeiträge, Nachrichten, Audio- und Videoinhalte. Viele Websites bieten RSS-Abonnementfunktionen an, sodass Benutzer problemlos die neuesten Informationen erhalten können. In diesem Artikel erfahren Sie, wie Sie PHP und XML verwenden, um die RSS-Abonnementverwaltungs- und Anzeigefunktionen der Website zu implementieren. Zuerst müssen wir ein RSS-Abonnement für XM erstellen

Der Hauptunterschied zwischen Go und Ruby besteht darin, dass Go eine statisch typisierte kompilierte Sprache ist, die leichte Parallelität und effiziente Speicherverwaltung unterstützt, und sich zum Schreiben von Anwendungen mit hoher Parallelität eignet. Ruby ist eine dynamisch typisierte interpretierte Sprache, die echte Parallelität, aber Speicherverwaltung unterstützt erfordert eine manuelle Steuerung und eignet sich zum Schreiben flexibler Webanwendungen.

Vielen Menschen ist möglicherweise ein Phänomen aufgefallen, nämlich dass in einigen modernen Programmiersprachen (natürlich nicht in Bezug auf „neue“ Programmiersprachen) die Inkrementierungs- und Dekrementierungsoperatoren abgeschafft wurden. Mit anderen Worten, es gibt in diesen Sprachen keinen Ausdruck wie i++ oder j--, sondern nur i+=1 oder j-=1. Ein solcher Ausdruck. In dieser Antwort werden die Hintergründe und Gründe für dieses Phänomen aus der Perspektive der Designphilosophie untersucht. Streng genommen könnte die Aussage „i++ verschwindet“ voreingenommen sein, da es den Anschein hat, dass nur Python, Rust und Swift unter den Mainstream-Programmiersprachen die Inkrement- und Dekrementoperatoren nicht unterstützen. Als ich zum ersten Mal mit Python in Kontakt kam, war dies auch der Fall

Mit der rasanten Entwicklung des Internets bieten immer mehr Websites RSS-Abonnementdienste an, sodass Benutzer problemlos aktualisierte Inhalte von der Website erhalten können. Als beliebte serverseitige Skriptsprache verfügt PHP über viele Funktionen zur Verarbeitung von RSS-Abonnements, sodass Entwickler die erforderlichen Daten einfach aus RSS-Quellen extrahieren können. In diesem Artikel wird erläutert, wie Sie mithilfe von PHP-Funktionen RSS-Abonnementinhalte erhalten. 1. Was ist RSS? Der vollständige Name von RSS lautet „ReallySimpleSyndication“ (abgekürzt).

Ruby betreibt MySQL mit MySQL2, um eine Verbindung zu MySQL herzustellen und MySQL zu betreiben. geminstallmysql2 stellt eine Verbindung zu MySQL her, um eine Verbindung herzustellen: require'mysql2'conn=Mysql2::Client.new({host:'192.168.200.73',username:'root',password:'P@ssword1!'}) Die akzeptierte Verbindung Zu den Optionen gehören: Mysql2::Clie

So schreiben Sie einen einfachen RSS-Abonnenten über PHP RSS (ReallySimpleSyndication) ist ein Format, das zum Abonnieren von Website-Inhalten verwendet wird. Über den Abonnenten können Sie die neuesten Artikel, Nachrichten, Blogs und andere Updates erhalten. In diesem Artikel schreiben wir einen einfachen RSS-Abonnenten mit PHP, um zu demonstrieren, wie man den Inhalt eines RSS-Feeds erhält und anzeigt. Bestätigen Sie die Umgebung und Vorbereitung. Bevor Sie beginnen, stellen Sie sicher, dass Sie über eine PHP-Umgebung verfügen und die SimpleXML-Erweiterung installiert haben.

So implementieren Sie mit MySQL und Ruby eine einfache Datenkonvertierungsfunktion. In der tatsächlichen Entwicklungsarbeit ist häufig eine Datenkonvertierung erforderlich, um ein Datenformat in ein anderes zu konvertieren. In diesem Artikel wird erläutert, wie Sie mithilfe von MySQL und Ruby eine einfache Datenkonvertierungsfunktion implementieren, und es werden spezifische Codebeispiele bereitgestellt. Zuerst müssen wir die MySQL- und Ruby-Umgebungen installieren und konfigurieren. Stellen Sie sicher, dass Sie eine MySQL-Datenbank installiert haben und über die Befehlszeile oder andere Tools eine Verbindung zur Datenbank herstellen können. Darüber hinaus müssen Sie installieren
