ホームページ Java &#&チュートリアル Java マルチスレッドが Ringtone Duoduo の公式 Web サイトから着信音データをキャプチャします

Java マルチスレッドが Ringtone Duoduo の公式 Web サイトから着信音データをキャプチャします

Jan 05, 2017 pm 02:16 PM
Javaマルチスレッド

一直想练习下java多线程抓取数据。

有天被我发现,铃声多多的官网(http://www.shoujiduoduo.com/main/)有大量的数据。

通过观察他们前端获取铃声数据的ajax

Java マルチスレッドが Ringtone Duoduo の公式 Web サイトから着信音データをキャプチャします

http://www.shoujiduoduo.com/ringweb/ringweb.php?type=getlist&listid={类别ID}&page={分页页码}

很容易就能发现通过改变 listId和page就能从服务器获取铃声的json数据, 通过解析json数据,

可以看到都带有{"hasmore":1,"curpage":1}这样子的指示,通过判断hasmore的值,决定是否进行下一页的抓取。

但是通过上面这个链接返回的json中不带有铃声的下载地址

很快就可以发现,点击页面的“下载”会看到

通过下面的请求,就可以获取铃声的下载地址了

http://www.shoujiduoduo.com/ringweb/ringweb.php?type=geturl&act=down&rid={铃声ID}

Java マルチスレッドが Ringtone Duoduo の公式 Web サイトから着信音データをキャプチャします

所以,他们的数据是很容易被偷的。于是我就开始...

源码已经发在github上。如果感兴趣的童鞋可以查看

github:https://github.com/yongbo000/DuoduoAudioRobot

上代码:

<pre class="brush:java;">package me.yongbo.DuoduoRingRobot;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.Iterator;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import com.google.gson.Gson;
import com.google.gson.JsonArray;
import com.google.gson.JsonElement;
import com.google.gson.JsonParser;
/* * @author yongbo_ * @created 2013/4/16 * * */
public class DuoduoRingRobotClient implements Runnable {
public static String GET_RINGINFO_URL = "http://www.shoujiduoduo.com/ringweb/ringweb.php?type=getlist&listid=%1$d&page=%2$d";
public static String GET_DOWN_URL = "http://www.shoujiduoduo.com/ringweb/ringweb.php?type=geturl&act=down&rid=%1$d";
public static String ERROR_MSG = "listId为 %1$d 的Robot发生错误,已自动停止。当前page为 %2$d";public static String STATUS_MSG = "开始抓取数据,当前listId: %1$d,当前page: %2$d";
public static String FILE_DIR = "E:/RingData/";public static String FILE_NAME = "listId=%1$d.txt";private boolean errorFlag = false;private int listId;private int page;
private int endPage = -1;private int hasMore = 1;
private DbHelper dbHelper;
/** * 构造函数 * @param listId 菜单ID * @param page 开始页码 * @param endPage 结束页码 * */
public DuoduoRingRobotClient(int listId, int beginPage, int endPage)
 {this.listId = listId;this.page = beginPage;this.endPage = endPage;this.dbHelper = new DbHelper();}
/** * 构造函数 * @param listId 菜单ID * @param page 开始页码 * */
public DuoduoRingRobotClient(int listId, int page) {this(listId, page, -1);}
/** * 获取铃声 * */public void getRings() {String url = String.format(GET_RINGINFO_URL, listId, page);String responseStr = httpGet(url);hasMore = getHasmore(responseStr);
page = getNextPage(responseStr);
ringParse(responseStr.replaceAll("\\{\"hasmore\":[0-9]*,\"curpage\":[0-9]*\\},", "").replaceAll(",]", "]"));}/** * 发起http请求 * @param webUrl 请求连接地址 * */public String httpGet(String webUrl){URL url;URLConnection conn;StringBuilder sb = new StringBuilder();String resultStr = "";try {url = new URL(webUrl);conn = url.openConnection();conn.connect();InputStream is = conn.getInputStream();InputStreamReader isr = new InputStreamReader(is);BufferedReader bufReader = new BufferedReader(isr);String lineText;while ((lineText = bufReader.readLine()) != null) {sb.append(lineText);}resultStr = sb.toString();} catch (Exception e) {errorFlag = true;//将错误写入txtwriteToFile(String.format(ERROR_MSG, listId, page));}return resultStr;}/** * 将json字符串转化成Ring对象,并存入txt中 * @param json Json字符串 * */public void ringParse(String json) {Ring ring = null;JsonElement element = new JsonParser().parse(json);JsonArray array = element.getAsJsonArray();// 遍历数组Iterator<JsonElement> it = array.iterator();
Gson gson = new Gson();while (it.hasNext() && !errorFlag) {JsonElement e = it.next();// JsonElement转换为JavaBean对象ring = gson.fromJson(e, Ring.class);ring.setDownUrl(getRingDownUrl(ring.getId()));if(isAvailableRing(ring)) {System.out.println(ring.toString());
//可选择写入数据库还是写入文本//writeToFile(ring.toString());writeToDatabase(ring);}}}
/** * 写入txt * @param data 字符串 * */public void writeToFile(String data)
 {String path = FILE_DIR + String.format(FILE_NAME, listId);File dir = new File(FILE_DIR);File file = new File(path);FileWriter fw = null;if(!dir.exists()){dir.mkdirs();
}try {if(!file.exists()){file.createNewFile();}fw = new FileWriter(file, true);
fw.write(data);fw.write("\r\n");fw.flush();} catch (IOException e) {
// TODO Auto-generated catch blocke.printStackTrace();
}finally {try {if(fw != null){fw.close();}} catch (IOException e) {
// TODO Auto-generated catch blocke.printStackTrace();}}}/** * 写入数据库 * @param ring 一个Ring的实例 * */
public void writeToDatabase(Ring ring) {dbHelper.execute("addRing", ring);}
@Overridepublic void run() {while(hasMore == 1 && !errorFlag){if(endPage != -1){if(page > endPage) { break; }}System.out.println(String.format(STATUS_MSG, listId, page));
getRings();System.out.println(String.format("该页数据写入完成"));}System.out.println("ending...");}
private int getHasmore(String resultStr){Pattern p = Pattern.compile("\"hasmore\":([0-9]*),\"curpage\":([0-9]*)"); 
 Matcher match = p.matcher(resultStr);  
 if (match.find()) {  return Integer.parseInt(match.group(1));
  }  return 0;
}
private int getNextPage(String resultStr){Pattern p = Pattern.compile("\"hasmore\":([0-9]*),\"curpage\":([0-9]*)");Matcher match = p.matcher(resultStr);if (match.find()) {return Integer.parseInt(match.group(2));}return 0;}
/** * 判断当前Ring是否满足条件。当Ring的name大于50个字符或是duration为小数则不符合条件,将被剔除。 * @param ring 当前Ring对象实例 * */private boolean isAvailableRing(Ring ring){Pattern p = Pattern.compile("^[1-9][0-9]*$");
Matcher match = p.matcher(ring.getDuration());
if(!match.find()){return false;}if(ring.getName().length() > 50 || ring.getArtist().length() > 50 || ring.getDownUrl().length() == 0){return false;}return true;}
/** * 获取铃声的下载地址 * @param rid 铃声的id * */
public String getRingDownUrl(String rid){String url = String.format(GET_DOWN_URL, rid);
String responseStr = httpGet(url);return responseStr;}}
ログイン後にコピー

更多Java マルチスレッドが Ringtone Duoduo の公式 Web サイトから着信音データをキャプチャします相关文章请关注PHP中文网!

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Javaのvolatileキーワードの使用シナリオと機能の詳細な説明 Javaのvolatileキーワードの使用シナリオと機能の詳細な説明 Jan 30, 2024 am 10:01 AM

Java における volatile キーワードの役割と適用シナリオの詳細説明 1. volatile キーワードの役割 Java では、volatile キーワードは、複数のスレッド間で参照できる変数を識別する、つまり可視性を確保するために使用されます。具体的には、変数が volatile と宣言されると、その変数への変更は他のスレッドに即座に知られます。 2. Volatile キーワード ステータス フラグのアプリケーション シナリオ volatile キーワードは、次のようないくつかのステータス フラグ シナリオに適しています。

ファイル読み込みマルチスレッド加速性能のためのJava開発最適化手法 ファイル読み込みマルチスレッド加速性能のためのJava開発最適化手法 Jun 30, 2023 pm 10:54 PM

Java 開発では、ファイルの読み取りは非常に一般的で重要な操作です。ビジネスが成長するにつれて、ファイルのサイズと数も増加します。ファイルの読み取り速度を向上させるために、マルチスレッドを使用してファイルを並行して読み取ることができます。この記事では、Java 開発におけるファイル読み取りマルチスレッド アクセラレーションのパフォーマンスを最適化する方法を紹介します。まず、ファイルを読み取る前に、ファイルのサイズと量を決定する必要があります。ファイルのサイズと数に応じて、スレッド数を適切に設定できます。スレッド数が多すぎるとリソースが無駄になる可能性があります。

Java マルチスレッド環境での例外処理 Java マルチスレッド環境での例外処理 May 01, 2024 pm 06:45 PM

マルチスレッド環境での例外処理の重要なポイント: 例外のキャッチ: 各スレッドは try-catch ブロックを使用して例外をキャッチします。例外の処理: エラー情報を出力するか、catch ブロックでエラー処理ロジックを実行します。スレッドを終了する: 回復が不可能な場合は、Thread.stop() を呼び出してスレッドを終了します。 UncaughtExceptionHandler: キャッチされなかった例外を処理するには、このインターフェイスを実装し、スレッドに割り当てる必要があります。実際のケース: スレッド プールでの例外処理。UncaughtExceptionHandler を使用してキャッチされなかった例外を処理します。

Java マルチスレッドの動作原理と特性を調べる Java マルチスレッドの動作原理と特性を調べる Feb 21, 2024 pm 03:39 PM

Java マルチスレッドの動作原理と特性を探る はじめに: 最新のコンピュータ システムでは、マルチスレッドは同時処理の一般的な方法となっています。 Java は強力なプログラミング言語として、豊富なマルチスレッド メカニズムを提供し、プログラマがコンピュータのマルチコア プロセッサを有効に活用し、プログラムの実行効率を向上させることができます。この記事では、Java マルチスレッドの動作原理と特性を探り、具体的なコード例で説明します。 1. マルチスレッドの基本概念 マルチスレッドとは、プログラム内で複数のスレッドを同時に実行し、各スレッドが異なる処理を実行することをいいます。

Java マルチスレッド パフォーマンス最適化ガイド Java マルチスレッド パフォーマンス最適化ガイド Apr 11, 2024 am 11:36 AM

『Java マルチスレッド パフォーマンス最適化ガイド』には、次の 5 つの主要な最適化ポイントが記載されています。 スレッドの作成と破棄のオーバーヘッドを削減する 不適切なロック競合を回避する 非ブロッキング データ構造を使用する Happens-Before 関係を活用する ロックフリーの並列アルゴリズムを検討する

Javaマルチスレッドデバッグ技術が明らかに Javaマルチスレッドデバッグ技術が明らかに Apr 12, 2024 am 08:15 AM

マルチスレッド デバッグ テクノロジの答え: 1. マルチスレッド コード デバッグの課題: スレッド間の相互作用により、複雑で追跡が困難な動作が発生します。 2. Java マルチスレッド デバッグ テクノロジ: 行ごとのデバッグ スレッド ダンプ (jstack) エントリおよび終了イベントの監視 スレッド ローカル変数 3. 実際のケース: スレッド ダンプを使用してデッドロックを検出し、監視イベントを使用してデッドロックの原因を特定します。 4. 結論: Java が提供するマルチスレッド デバッグ テクノロジは、スレッド セーフ、デッドロック、競合に関連する問題を効果的に解決できます。

Java のマルチスレッドの安全性の問題 - java.lang.ThreadDeath の解決策 Java のマルチスレッドの安全性の問題 - java.lang.ThreadDeath の解決策 Jun 25, 2023 am 11:22 AM

Java は現代のソフトウェア開発で広く使用されているプログラミング言語であり、そのマルチスレッド プログラミング機能も Java の最大の利点の 1 つです。ただし、マルチスレッドによって引き起こされる同時アクセスの問題により、Java ではマルチスレッドの安全性の問題が頻繁に発生します。その中でも、java.lang.ThreadDeath は典型的なマルチスレッドのセキュリティ問題です。この記事ではjava.lang.ThreadDeathの原因と解決策を紹介します。 1. java.lang.ThreadDeath の理由

Java マルチスレッド同時実行ロックの詳細な説明 Java マルチスレッド同時実行ロックの詳細な説明 Apr 11, 2024 pm 04:21 PM

Java 同時実行ロック メカニズムにより、マルチスレッド環境では共有リソースに 1 つのスレッドのみがアクセスできるようになります。その種類には、悲観的ロック (ロックを取得してからアクセスする) と楽観的ロック (アクセス後に競合を確認する) があります。 Java は、ReentrantLock (ミューテックス ロック)、Semaphore (セマフォ)、ReadWriteLock (読み取り/書き込みロック) などの組み込み同時実行ロック クラスを提供します。これらのロックを使用すると、複数のスレッドが共有変数カウンターに同時にアクセスしたときに、1 つのスレッドだけがその値を更新するなど、共有リソースへのスレッドセーフなアクセスを保証できます。

See all articles