遇到一个比较棘手的需求:
开发语言Java;
程序定时读取HR邮箱中从前程无忧,智联发过来的简历(已实现,获到简历的HTML);
从简历HTML中解析获取想要的信息想(姓名,性别,电话,邮箱,工作经历,教育经历等等),保存到数据库中;
把数据库中的简历数据用HTML展示,可让HR进行筛选;
我现在卡在了简历HTML的解析信息这步,我用比较笨的方法,字符串定位截取,但是这样没办法比较准确的获取到想要信息。。。求助大家,看有没有好方法解析。。
Adalah lebih baik menggunakan Jsoup untuk menukarnya menjadi objek Dokumen yang sepadan, yang lebih mudah apabila mengendalikan elemen yang sepadan. Jsoup API: http://www.open-open.com/jsoup/
Bagaimana pula dengan menggunakan ungkapan biasa? Fikirkan lebih lanjut tentang kemungkinan format padanan dan ia sepatutnya OK.
Adalah lebih baik menggunakan tangkapan biasa
Anda boleh menggunakan jsoup
Anda boleh menggunakan JSOUP Saya telah melakukan sesuatu yang serupa sebelum ini. Ini sangat mudah dan boleh memproses pelbagai tag dan sebagainya.
Lebih suka jsoup. jsoup mempunyai fungsi pilih, yang serupa dengan sintaks pemilih CSS API adalah mudah dan mudah daripada ungkapan biasa.
1 Biasa 2 perpustakaan penghuraian HTML, yang nampaknya dipanggil "mithril" dalam bahasa Cina
Adalah lebih baik menggunakan Jsoup untuk menukarnya menjadi objek Dokumen yang sepadan, yang lebih mudah apabila mengendalikan elemen yang sepadan.
Jsoup API: http://www.open-open.com/jsoup/
Bagaimana pula dengan menggunakan ungkapan biasa? Fikirkan lebih lanjut tentang kemungkinan format padanan dan ia sepatutnya OK.
Adalah lebih baik menggunakan tangkapan biasa
Anda boleh menggunakan jsoup
Anda boleh menggunakan JSOUP Saya telah melakukan sesuatu yang serupa sebelum ini. Ini sangat mudah dan boleh memproses pelbagai tag dan sebagainya.
Lebih suka jsoup.
jsoup mempunyai fungsi pilih, yang serupa dengan sintaks pemilih CSS API adalah mudah dan mudah daripada ungkapan biasa.
1 Biasa
2 perpustakaan penghuraian HTML, yang nampaknya dipanggil "mithril" dalam bahasa Cina