Heim Java javaLernprogramm Java-Multithreading erfasst Klingeltondaten von der offiziellen Website von Ringtone Duoduo

Java-Multithreading erfasst Klingeltondaten von der offiziellen Website von Ringtone Duoduo

Jan 05, 2017 pm 02:16 PM
java多线程

一直想练习下java多线程抓取数据。

有天被我发现,铃声多多的官网(http://www.shoujiduoduo.com/main/)有大量的数据。

通过观察他们前端获取铃声数据的ajax

Java-Multithreading erfasst Klingeltondaten von der offiziellen Website von Ringtone Duoduo

http://www.shoujiduoduo.com/ringweb/ringweb.php?type=getlist&listid={类别ID}&page={分页页码}

很容易就能发现通过改变 listId和page就能从服务器获取铃声的json数据, 通过解析json数据,

可以看到都带有{"hasmore":1,"curpage":1}这样子的指示,通过判断hasmore的值,决定是否进行下一页的抓取。

但是通过上面这个链接返回的json中不带有铃声的下载地址

很快就可以发现,点击页面的“下载”会看到

通过下面的请求,就可以获取铃声的下载地址了

http://www.shoujiduoduo.com/ringweb/ringweb.php?type=geturl&act=down&rid={铃声ID}

Java-Multithreading erfasst Klingeltondaten von der offiziellen Website von Ringtone Duoduo

所以,他们的数据是很容易被偷的。于是我就开始...

源码已经发在github上。如果感兴趣的童鞋可以查看

github:https://github.com/yongbo000/DuoduoAudioRobot

上代码:

<pre class="brush:java;">package me.yongbo.DuoduoRingRobot;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.Iterator;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import com.google.gson.Gson;
import com.google.gson.JsonArray;
import com.google.gson.JsonElement;
import com.google.gson.JsonParser;
/* * @author yongbo_ * @created 2013/4/16 * * */
public class DuoduoRingRobotClient implements Runnable {
public static String GET_RINGINFO_URL = "http://www.shoujiduoduo.com/ringweb/ringweb.php?type=getlist&listid=%1$d&page=%2$d";
public static String GET_DOWN_URL = "http://www.shoujiduoduo.com/ringweb/ringweb.php?type=geturl&act=down&rid=%1$d";
public static String ERROR_MSG = "listId为 %1$d 的Robot发生错误,已自动停止。当前page为 %2$d";public static String STATUS_MSG = "开始抓取数据,当前listId: %1$d,当前page: %2$d";
public static String FILE_DIR = "E:/RingData/";public static String FILE_NAME = "listId=%1$d.txt";private boolean errorFlag = false;private int listId;private int page;
private int endPage = -1;private int hasMore = 1;
private DbHelper dbHelper;
/** * 构造函数 * @param listId 菜单ID * @param page 开始页码 * @param endPage 结束页码 * */
public DuoduoRingRobotClient(int listId, int beginPage, int endPage)
 {this.listId = listId;this.page = beginPage;this.endPage = endPage;this.dbHelper = new DbHelper();}
/** * 构造函数 * @param listId 菜单ID * @param page 开始页码 * */
public DuoduoRingRobotClient(int listId, int page) {this(listId, page, -1);}
/** * 获取铃声 * */public void getRings() {String url = String.format(GET_RINGINFO_URL, listId, page);String responseStr = httpGet(url);hasMore = getHasmore(responseStr);
page = getNextPage(responseStr);
ringParse(responseStr.replaceAll("\\{\"hasmore\":[0-9]*,\"curpage\":[0-9]*\\},", "").replaceAll(",]", "]"));}/** * 发起http请求 * @param webUrl 请求连接地址 * */public String httpGet(String webUrl){URL url;URLConnection conn;StringBuilder sb = new StringBuilder();String resultStr = "";try {url = new URL(webUrl);conn = url.openConnection();conn.connect();InputStream is = conn.getInputStream();InputStreamReader isr = new InputStreamReader(is);BufferedReader bufReader = new BufferedReader(isr);String lineText;while ((lineText = bufReader.readLine()) != null) {sb.append(lineText);}resultStr = sb.toString();} catch (Exception e) {errorFlag = true;//将错误写入txtwriteToFile(String.format(ERROR_MSG, listId, page));}return resultStr;}/** * 将json字符串转化成Ring对象,并存入txt中 * @param json Json字符串 * */public void ringParse(String json) {Ring ring = null;JsonElement element = new JsonParser().parse(json);JsonArray array = element.getAsJsonArray();// 遍历数组Iterator<JsonElement> it = array.iterator();
Gson gson = new Gson();while (it.hasNext() && !errorFlag) {JsonElement e = it.next();// JsonElement转换为JavaBean对象ring = gson.fromJson(e, Ring.class);ring.setDownUrl(getRingDownUrl(ring.getId()));if(isAvailableRing(ring)) {System.out.println(ring.toString());
//可选择写入数据库还是写入文本//writeToFile(ring.toString());writeToDatabase(ring);}}}
/** * 写入txt * @param data 字符串 * */public void writeToFile(String data)
 {String path = FILE_DIR + String.format(FILE_NAME, listId);File dir = new File(FILE_DIR);File file = new File(path);FileWriter fw = null;if(!dir.exists()){dir.mkdirs();
}try {if(!file.exists()){file.createNewFile();}fw = new FileWriter(file, true);
fw.write(data);fw.write("\r\n");fw.flush();} catch (IOException e) {
// TODO Auto-generated catch blocke.printStackTrace();
}finally {try {if(fw != null){fw.close();}} catch (IOException e) {
// TODO Auto-generated catch blocke.printStackTrace();}}}/** * 写入数据库 * @param ring 一个Ring的实例 * */
public void writeToDatabase(Ring ring) {dbHelper.execute("addRing", ring);}
@Overridepublic void run() {while(hasMore == 1 && !errorFlag){if(endPage != -1){if(page > endPage) { break; }}System.out.println(String.format(STATUS_MSG, listId, page));
getRings();System.out.println(String.format("该页数据写入完成"));}System.out.println("ending...");}
private int getHasmore(String resultStr){Pattern p = Pattern.compile("\"hasmore\":([0-9]*),\"curpage\":([0-9]*)"); 
 Matcher match = p.matcher(resultStr);  
 if (match.find()) {  return Integer.parseInt(match.group(1));
  }  return 0;
}
private int getNextPage(String resultStr){Pattern p = Pattern.compile("\"hasmore\":([0-9]*),\"curpage\":([0-9]*)");Matcher match = p.matcher(resultStr);if (match.find()) {return Integer.parseInt(match.group(2));}return 0;}
/** * 判断当前Ring是否满足条件。当Ring的name大于50个字符或是duration为小数则不符合条件,将被剔除。 * @param ring 当前Ring对象实例 * */private boolean isAvailableRing(Ring ring){Pattern p = Pattern.compile("^[1-9][0-9]*$");
Matcher match = p.matcher(ring.getDuration());
if(!match.find()){return false;}if(ring.getName().length() > 50 || ring.getArtist().length() > 50 || ring.getDownUrl().length() == 0){return false;}return true;}
/** * 获取铃声的下载地址 * @param rid 铃声的id * */
public String getRingDownUrl(String rid){String url = String.format(GET_DOWN_URL, rid);
String responseStr = httpGet(url);return responseStr;}}
Nach dem Login kopieren

更多Java-Multithreading erfasst Klingeltondaten von der offiziellen Website von Ringtone Duoduo相关文章请关注PHP中文网!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Java-Entwicklungsoptimierungsmethode für die Multithread-Beschleunigungsleistung beim Lesen von Dateien Java-Entwicklungsoptimierungsmethode für die Multithread-Beschleunigungsleistung beim Lesen von Dateien Jun 30, 2023 pm 10:54 PM

In der Java-Entwicklung ist das Lesen von Dateien ein sehr häufiger und wichtiger Vorgang. Wenn Ihr Unternehmen wächst, wachsen auch die Größe und die Anzahl der Dateien. Um die Geschwindigkeit des Dateilesens zu erhöhen, können wir Multithreading verwenden, um Dateien parallel zu lesen. In diesem Artikel wird erläutert, wie Sie die Multithread-Beschleunigungsleistung beim Lesen von Dateien in der Java-Entwicklung optimieren können. Bevor wir die Datei lesen, müssen wir zunächst die Größe und Menge der Datei bestimmen. Abhängig von der Größe und Anzahl der Dateien können wir die Anzahl der Threads angemessen festlegen. Eine übermäßige Anzahl von Threads kann zu einer Verschwendung von Ressourcen führen.

Detaillierte Erläuterung der Verwendungsszenarien und Funktionen des flüchtigen Schlüsselworts in Java Detaillierte Erläuterung der Verwendungsszenarien und Funktionen des flüchtigen Schlüsselworts in Java Jan 30, 2024 am 10:01 AM

Detaillierte Erläuterung der Rolle und Anwendungsszenarien des Schlüsselworts volatile in Java 1. Die Rolle des Schlüsselworts volatile In Java wird das Schlüsselwort volatile verwendet, um eine Variable zu identifizieren, die zwischen mehreren Threads sichtbar ist, dh um die Sichtbarkeit sicherzustellen. Insbesondere wenn eine Variable als flüchtig deklariert wird, sind alle Änderungen an der Variablen sofort anderen Threads bekannt. 2. Anwendungsszenarien des flüchtigen Schlüsselworts Das flüchtige Schlüsselwort Statusflag eignet sich für einige Statusflag-Szenarien, z

Entdecken Sie die Funktionsprinzipien und Eigenschaften von Java-Multithreading Entdecken Sie die Funktionsprinzipien und Eigenschaften von Java-Multithreading Feb 21, 2024 pm 03:39 PM

Entdecken Sie die Funktionsprinzipien und Eigenschaften von Java-Multithreading. Einführung: In modernen Computersystemen ist Multithreading zu einer gängigen Methode der gleichzeitigen Verarbeitung geworden. Als leistungsstarke Programmiersprache bietet Java einen umfassenden Multithreading-Mechanismus, der es Programmierern ermöglicht, den Multi-Core-Prozessor des Computers besser zu nutzen und die Effizienz der Programmausführung zu verbessern. In diesem Artikel werden die Funktionsprinzipien und Eigenschaften von Java-Multithreading untersucht und anhand spezifischer Codebeispiele veranschaulicht. 1. Das Grundkonzept des Multithreadings Multithreading bezieht sich auf die gleichzeitige Ausführung mehrerer Threads in einem Programm, wobei jeder Thread unterschiedliche Prozesse verarbeitet

Java-Multithread-Debugging-Technologie enthüllt Java-Multithread-Debugging-Technologie enthüllt Apr 12, 2024 am 08:15 AM

Antworten der Multithread-Debugging-Technologie: 1. Herausforderungen beim Multithread-Code-Debugging: Die Interaktion zwischen Threads führt zu komplexem und schwer nachverfolgbarem Verhalten. 2. Java-Multithread-Debugging-Technologie: Zeilenweises Debuggen von Thread-Dumps (jstack) zum Überwachen von Ein- und Ausgangsereignissen, Thread-Lokalvariablen. 3. Praktischer Fall: Verwenden Sie Thread-Dump, um Deadlocks zu finden, und verwenden Sie Monitorereignisse, um die Ursache des Deadlocks zu ermitteln. 4. Schlussfolgerung: Die von Java bereitgestellte Multi-Thread-Debugging-Technologie kann Probleme im Zusammenhang mit Thread-Sicherheit, Deadlock und Konflikten effektiv lösen.

Leitfaden zur Java-Multithreading-Leistungsoptimierung Leitfaden zur Java-Multithreading-Leistungsoptimierung Apr 11, 2024 am 11:36 AM

Der Java Multithreading Performance Optimization Guide bietet fünf wichtige Optimierungspunkte: Reduzieren Sie den Aufwand für die Thread-Erstellung und -Zerstörung. Vermeiden Sie unangemessene Sperrenkonflikte. Verwenden Sie nicht blockierende Datenstrukturen. Nutzen Sie Happens-Before-Beziehungen. Ziehen Sie sperrenfreie parallele Algorithmen in Betracht

Ausnahmebehandlung in einer Java-Multithread-Umgebung Ausnahmebehandlung in einer Java-Multithread-Umgebung May 01, 2024 pm 06:45 PM

Wichtige Punkte der Ausnahmebehandlung in einer Multithread-Umgebung: Ausnahmen abfangen: Jeder Thread verwendet einen Try-Catch-Block, um Ausnahmen abzufangen. Ausnahmen behandeln: Fehlerinformationen drucken oder Fehlerbehandlungslogik im Catch-Block ausführen. Beenden Sie den Thread: Wenn eine Wiederherstellung nicht möglich ist, rufen Sie Thread.stop() auf, um den Thread zu beenden. UncaughtExceptionHandler: Um nicht abgefangene Ausnahmen zu verarbeiten, müssen Sie diese Schnittstelle implementieren und sie dem Thread zuweisen. Praktischer Fall: Ausnahmebehandlung im Thread-Pool, Verwendung von UncaughtExceptionHandler zur Behandlung nicht abgefangener Ausnahmen.

Detaillierte Erläuterung der Java-Multithread-Parallelitätssperre Detaillierte Erläuterung der Java-Multithread-Parallelitätssperre Apr 11, 2024 pm 04:21 PM

Der Java-Parallelitätssperrmechanismus stellt sicher, dass in einer Multithread-Umgebung nur ein Thread auf gemeinsam genutzte Ressourcen zugreift. Zu seinen Typen gehören pessimistisches Sperren (Sperre erwerben und dann darauf zugreifen) und optimistisches Sperren (nach dem Zugriff auf Konflikte prüfen). Java bietet integrierte Parallelitätssperrklassen wie ReentrantLock (Mutex-Sperre), Semaphore (Semaphor) und ReadWriteLock (Lese-/Schreibsperre). Durch die Verwendung dieser Sperren kann ein Thread-sicherer Zugriff auf gemeinsam genutzte Ressourcen gewährleistet werden. So kann beispielsweise sichergestellt werden, dass nur ein Thread seinen Wert aktualisiert, wenn mehrere Threads gleichzeitig auf den Zähler für gemeinsam genutzte Variablen zugreifen.

Multithread-Sicherheitsprobleme in Java – Lösungen für java.lang.ThreadDeath Multithread-Sicherheitsprobleme in Java – Lösungen für java.lang.ThreadDeath Jun 25, 2023 am 11:22 AM

Java ist eine in der modernen Softwareentwicklung weit verbreitete Programmiersprache, und ihre Multithread-Programmierfähigkeiten sind auch einer ihrer größten Vorteile. Aufgrund der durch Multithreading verursachten gleichzeitigen Zugriffsprobleme treten in Java jedoch häufig Multithread-Sicherheitsprobleme auf. Unter diesen ist java.lang.ThreadDeath ein typisches Multithread-Sicherheitsproblem. In diesem Artikel werden die Ursachen und Lösungen von java.lang.ThreadDeath vorgestellt. 1. Gründe für java.lang.ThreadDeath

See all articles