随着信息技术和人类生产生活交汇融合,互联网快速普及,全球数据呈现爆发增长、海量集聚的特点。有人感叹:数据是新的石油,是本世纪最为珍贵的财产。作为信息化发展的新阶段,大数据对经济发展、社会秩序、国家治理、人民生活都将产生重大影响。“谁掌握了数据,谁就掌握了主动权”。现在,世界各国都把推进经济数字化作为实现创新发展的重要动能,在技术研发、数据共享、安全保护等方面进行前瞻性布局。抓住大数据发展的时代机遇,开创发展新局面,也是我国必须解答好的时代课题。
大数据不仅是一场技术和产业革命,也将带来国家治理的深刻变革。运用大数据提升国家治理现代化水平,是新的治理课题。从建立健全大数据辅助科学决策和社会治理的机制,到保障国家数据安全,打破信息壁垒、推动信息共享,再到利用大数据平台形成社会治理合力,用好大数据这个利器,将有力提升治理科学化、精准化、高效化水平,增强服务经济社会发展、防范化解风险的能力。“工欲善其事,必先利其器。”善于获取数据、分析数据、运用数据,是互联网从业人员做好工作的基本功。懂得大数据,用好大数据,增强利用数据推进各项工作的本领,已经成为互联网从业人员的新时代必修课。
NLPIR大数据语义智能教学科研平台是大数据语义智能分析专业的教学科研综合平台。平台以自然语言理解为核心,结合北理工团队多年的科学研究与一线教学经验,以科学严谨的方式,致力于提升学员大数据与人工智能的教学培训、科学研究与工程实践的水平。
NLPIR大数据语义智能教学科研平台具有一套完善且丰富的教学体系,课程教材、视频教学、实训平台、实验验证和项目案例五位一体。
NLPIR大数据语义智能教学科研平台教学内容丰富,主要围绕大数据、人工智能和自然语言理解三大核心领域展开,核心内容包括以下几个方面:
1)科学的大数据观:大数据的定义,科学发展渊源;如何科学看待大数据?如何把握大数据,分别从“知著”、“显微”、“晓义”三个层面阐述科学的大数据观。
2)大数据技术平台与架构:云计算技术与开源平台搭建;Hadoop、Spark等数据架构、计算范式与应用实践;TensorFlow深度学习平台。
3)机器学习与常用数据挖掘:常用机器学习算法:Bayes, SVM,深度神经网络等;常用数据挖掘技术:关联规则挖掘、分类、聚类、奇异点分析;深度学习:CNN, RNN, LSTM, Attention模型,seq2seq模型。
4)大数据语义精准搜索:通用搜索引擎与大数据垂直业务的矛盾;大数据精准搜索的基本技术:快速增量倒排索引、结构化与非机构化数据融合、大数据排序算法、语义关联、自动缓存与优化机制;大数据精准搜索语法:邻近搜索、复合搜索、情感搜索、精准搜索;
5)非结构化大数据语义挖掘
语义理解基础:ICTCLAS与汉语分词;内容关键语义自动标引与词云自动生成;大数据聚类;大数据分类与信息过滤;大数据去重、自动摘要;情感分析与情绪计算;不良信息智能过滤.
6)知识图谱的大数据自动构建与应用:知识图谱概念;知识点的自动发现;基于bootstrapping的知识大数据生成;
7)NLPIR智能语义平台:NLPIR智能语义分析在线云服务;NLPIR Parser语义分析平台实训;NLPIR智能语义二次开发接口与教程。
8)大数据应用案例剖析与综述:国家电网大数据应用案例;新媒体传播创新与头条应用;非结构化大数据挖掘。
毫无疑问,大数据的兴起给社会科学研究带来一系列深刻的机遇和挑战。尽管存在挑战,但我们坚信大数据这一新的伟大技术革命必将孕育互联网技术和应用的革命,中国科学人唯有主动拥抱变革,迎难而上,才能实现跨越式发展,不负时代重托。