· CNCC专题论坛聚焦之4:大数据高峰论坛

  10月23日下午,2014中国计算机大会的重要活动之一 ----“大数据高峰论坛”在郑州国际会展中心举行。

  近年来,大数据成为全球学术界、业界和政府高度关注的技术热点。大数据已提升到国家战略的高度。2014年,大数据进入了政府工作报告,被我国政府列为推动国家科技创新和引领国家未来产业发展的六大战略性创新产业之一。大数据的热潮来自于近几年来行业应用大数据处理需求的急剧增长、大数据分析处理的深度价值、以及近几年来大数据处理技术和平台的逐步发展成熟和普及应用。

  论坛邀请了来自百度、腾讯等著名互联网企业和行业以及来自学术界的专家学者就大数据处理技术方法、系统平台、以及互联网大数据分析和预测应用进行系统的介绍。与此同时,论坛还针对大数据技术、系统和应用等热点问题和未来发展趋势,邀请嘉宾与参会者进行互动交流和讨论。

  本次论坛执行主席由哈尔滨工业大学教授李建中和南京大学教授黄宜华共同担任。

  百度研究院大数据实验室数据科学家沈志勇在论坛上作了题为“百度大数据引擎与大数据预测实践”报告。他在报告中系统介绍了百度大数据预测分析技术,同时结合基于百度大数据引擎在各种预测分析应用中的实践,通过具体的案例分析,尤其是今年夏天足球世界杯赛事预测的成功案例,为大家介绍并分享百度大数据实验室在大数据预测分析中的相关技术与经验。

  腾讯公司社交网络运营部专家研究员岳亚丁在论坛上作了题为“社交网络的大数据建模框架探索”报告。他在报告中首先简略回顾腾讯社交网络的研究及应用成果,然后从尚未充分解决的若干问题出发,分析潜在问题和当前方法局限,对更一般性社交网络的建模给出一些思路建议,包括对最新计算智能技术的采用。接着提出理想中的模型框架,以及理想的模型框架探索方式。最后,对社交网络数据的应用潜力做出展望。

  CCF数据库专业委员会副主任、哈尔滨工业大学教授高宏作了题为“感知大数据获取与计算”报告。她在报告中介绍了感知大数据的基本概念,讨论了感知大数据计算的特点和挑战,探讨感知大数据获取与计算的主要研究问题,并简单介绍了在感知大数据获取与计算方面的初步探索和取得的初步研究结果。

  CCF大数据专家委员会副秘书长、南京大学教授黄宜华在论坛上作了“大数据机器学习与数据分析统一编程模型与平台”的报告。他的报告中指出:现有的Hadoop、Spark等多种大数据编程模型和平台在带来多样性选择的同时,对行业数据分析人员存在不易掌握使用、缺少统一的复杂分析编程方法、以及需要针对不同平台重复编写各种复杂分析算法的问题。他在简要介绍国际最新技术进展的基础上,介绍一种面向大数据机器学习与数据分析的跨平台统一编程模型与平台,提出了一种基于矩阵模型的机器学习与数据分析并行计算和编程模型,在此基础上介绍所设计实现的跨平台统一机器学习与数据分析编程框架;基于上述跨平台统一编程模型、框架和R语言,行业数据分析人员可方便快速地实现大数据机器学习和数据分析并行算法设计。

  金信网银金融信息副总经理李崇纲在论坛上作了“网络舆情大数据分析应用与产业发展”报告。他在报告中首先介绍了网络舆情监测分析技术与发展趋势以及主流的舆情分析技术的原理和主要应用,探讨大数据环境下舆情分析的技术发展趋势;在此基础上进一步梳理国内网络舆情的产业链条,回顾了产业发展历程,分析舆情分析产业各个环节、主要供应商、研究机构以及各自特点;最后探讨了大数据时代舆情管理的三大变革,从政府企业对舆情管理的需求出发,展望大数据时代舆情管理模式的三大未来变革,分别从思维模式变革、工作模式变革、以及技术模式变革,探讨和分享舆情大数据的发展趋势。

  星环信息科技(上海)有限公司联合创始人兼CTO孙元浩在论坛上作了“基于Spark的高效SQL统计和数据挖掘引擎”报告。他在报告中介绍了星环科技如何一步步改进和重构Spark以满足企业对交互式数据分析、批量数据处理和数据挖掘的需求,并在此基础上开发和构建一个高性能的SQL引擎以及基于R语言的统计挖掘引擎与平台,形成一站式大数据分析处理平台。

  论坛上,嘉宾和与会听众围绕大数据热点问题和发展趋势展开了热烈的互动交流。


沈志勇作”百度大数据引擎与大数据预测实践“报告


岳亚丁作”社交网络的大数据建模框架探索”报告


黄宜华作“大数据机器学习与数据分析统一编程模型与平台”报告


李崇纲作“网络舆情大数据分析应用与产业发展”报告


孙元浩作“基于Spark的高效SQL统计和数据挖掘引擎”报告