详细内容
1.互联网信息的高效采集,尤其是社交媒体,包括微博、QQ空间、微信公众号等等。受限于IP地址、用户账号等,社交媒体的采集难以高效,有些媒体比如QQ空间难以采集。要求对采集的信息从全面性、时效性等角度进行研究突破。2.信息的相关性判定,一方面根据采集关键字(或者组合)判定采集信息的相关性,另一方面采用爬虫采集的方法,判定属于特定专题的相关性,要求信息相关性判定准确率75%以上;3.信息的正负面判断,研究突破信息的正负面识别方法,要求准确率80%以上;4.研究突破用户发表信息的情感倾向性判定方法,要求准确率80%以上;5.研究突破话题提取、热点分析的方法,要求话题提取准确率70%以上,热点分析的准确率75%以上。企业多年从事互联网舆情监测、企业情报监测的技术攻关与产品研发的研究,在互联网信息采集、信息的深度分析等方面已经有了一定的基础,研发的产品已经在全国范围推广应用。但是,在信息采集的时效、特定目标的采集等方面需要提升,在信息的深度分析,包括相关性判定、正负面判断、情感倾向分析、热点挖掘等等方面需要提升。公司目前已经有与此产品技术相关的研发团队6人,拟投入资金30万元围绕上述目标开展技术攻关。