智媒创新和进步 让我们拥有更多感知世界的方式
发布时间:2021-11-24 20:15:15 所属栏目:评论 来源:互联网
导读:黄萱菁认为,对社会媒体发布的信息进行处理,首先需要理解媒体发布的文字内容,并在其中发现各种各样有价值的信息,即价值发现,随后在进行传播趋势预测。 她提到,价值发现和传播趋势预测实际上需要有很多基础支撑。比如通过自然语言处理技术让语言可计算,对社会媒
黄萱菁认为,对社会媒体发布的信息进行处理,首先需要理解媒体发布的文字内容,并在其中发现各种各样有价值的信息,即价值发现,随后在进行传播趋势预测。 她提到,价值发现和传播趋势预测实际上需要有很多基础支撑。比如通过自然语言处理技术让语言可计算,对社会媒体上非规范的语言结构进行分析,对不同语言的文字信息进行处理,以及利用技术手段对文字信息进行情感处理。 以下为黄萱菁演讲实录,内容经编辑略有删减: 各位嘉宾下午好,很高兴和大家分享我们在智能社会媒体挖掘上的一些工作和看法。 我们知道,今天中国有十亿多的互联网用户,用户、媒体从起床到睡觉,长时间沉浸在各种内容中间,进行各种内容消费。贯穿全天最重要的内容消费方式就是我们的社会媒体,统计表明过去几年间,人们消磨在社会媒体的时间越来越多,按照2019年的数据,人们每天有两个半小时在玩各种各样的社会媒体。 那我们要消费什么内容呢?首先,我们要和自己的亲人、朋友聊天,这是一类。然后我们要娱乐,我们要获取各种各样的信息,包括新闻信息、社交信息。我们分享自己发生的事情,跟大家分享自己的观点。 在社会媒体上面存在各种各样有价值的信息。首先是商业信息。有统计结果表明,在社交媒体上进行销售,它的转化率很高,大概有55%能最终转换为销售的行为。 除了商业价值,我们看一下社会媒体的社会价值,通过社会媒体可以向总理说话,可以建言献策。通过关注学术媒体我们可以知道会议的信息,比如投稿延期了,还可以宣传自己的工作,获取各种各样的信息。 过去几年,我们在社会媒体信息处理开展了一些研究,主要分成下面几块,第一块是理解社会媒体的内容,我是搞自然语言处理的,所以我们说的主要是文字内容。我们从社会媒体上发现有价值的信息,预测社会媒体未来的趋势。 主要工作分为两类,一类是价值发现,一类是传播预测。价值发现是在社会媒体发现各种各样有价值的信息,以日本地震这个话题为例,我们可以识别时间、地点、对象、范围等实体,能够判别实体的关系,还能够判断情感倾向,比如是谴责发生核泄漏的行为,对受害者表示同情,称之为价值发现。 在价值发现之后我们进行传播趋势预测,我们利用社会媒体构造一个异构网络,由信息空间和社交空间组成,在信息空间之上我们可以得到社会媒体的各种内容信息,通过社交空间,我们可以分析普通用户,网红、机构等用户,通过他们之间的互动形式,跟信息空间的交互,可以得到很多有价值的信息,从而进行各种各样的预测,比如可以预测谣言等各种各样的行为。 为了做价值发现和传播预测,我们需要有很多基础支撑,需要让字词句子篇章的语义可计算。语义的计算需要自然语言处理,作为社会媒体的语言信息处理还要考虑社会媒体的特殊性,比如字词不同的表现形式。另外中文也有中文的特殊性。 我们的研究主要是以自然语言处理作为基础支撑研究社会媒体的新闻发现,预测它的传播趋势。 首先是语义表示。所谓的向量,或者叫嵌入,指的是在统一语义空间用统一的方式去表示知识、文档、句子、词汇,便于进行语义分析、句法分析、词法分析等下游业务,其目的是为了解决大数据自然语言处理带来的数据稀疏问题,实现跨领域的迁移。 过去几年随着深度神经网络的发展,在词嵌入方面我们取得了很多的进展,大致上可以分成两个阶段,比如早期的,我们称之为上下文无关的词向量,它对每一个词产生可计算的、分布式的向量表示。但是它有一个缺点,不能处理一词多义的情况,比如说苹果,可以说我在苹果公司工作,也可以说我吃了苹果,这是两种“苹果”。用一个向量表示一个词是不够的,所以近年来更时髦,比如说基于BERT和ETMO的一些方法,能够生成上下文相关的词向量,根据一个词所在的句子判断整个句子的语义。 对我们来说,在社会媒体之上进行语言处理还面临更多挑战,比如首先社会媒体上例如“OMG”这样非规范的形式让语言结构难以分析,难以拟合;各种各样的网络用语,比如“C位出道”等,基本上每天都有新的词语出现,给语义分析带来了难度。 还有我们现在统计方法、神经网络的方法需要大量数据,尤其是人工标注的数据,但是社会媒体上标注数据的规模和我们常见的新闻领域相比可能只是1%的规模,可用的数据少了,必然带来社会媒体王巍在本次论坛上发表了《智媒时代:数据赋能热点新闻的发掘与传播》主题演讲,介绍了新浪利用人工智能、大数据、深度学习等技术对热点新闻运营的全流程赋能,并分享了自己对智能媒体未来发展的一些思考。 “智能媒体无时无刻不在创新与进步,它让我们拥有了更多感知世界的方式。”王巍认为,当人工智能发展进入到更高、更复杂的阶段,人类将面临新的机遇与挑战。媒体智能化升级,意味着媒体运营效率的提升,以及对人脑的解放。但不能忽略的是,人是有情感、会思考的,人脑始终是新闻价值的判断者。我们必须在发展智媒的同时,平衡好人脑价值与智能效率的关系,只有协同发展,才能使人工智能赋予媒体更大的价值。 回顾国家层面智能媒体发展政策走向,媒体深度融合与新基建赋能无疑是关键词。随着5G、大数据、云计算、物联网、区块链、人工智能等信息技术革命成果的到来,加强新技术在新闻传播领域的前瞻性研究和应用,推动关键核心技术自主创新,是媒体融合建设向纵深发展的总方向。 王巍表示,一直以来,新浪非常关注新技术驱动传媒产业的发展走势,新浪既是媒体行业的深耕者,也是媒体技术的尝鲜者,实践者。在新技术的影响下,人工智能将更加全面、深入地介入、渗透、融合于媒体,成为智媒时代媒体向纵深进一步融合发展的决定性因素,助力媒体行业开启深融合、一体化、智能化、广场域的智媒新时代。 “基于我们对新技术和行业的洞察研究,新浪从2016年起就开始为智媒时代布局,除了社交媒体微博以外,还着力打造了新浪智能媒体平台。”他介绍,新浪已经完成了智能媒体平台的转型,形成了三平台、一矩阵、多终端的产品架构。“这些年我们取得了一定成绩,以新浪主要产品平台新浪新闻客户端为例,目前,日均活跃用户大概在7000万,月活跃用户规模接近在1.4亿左右,这是来自第三方数据机构的数据”。应用性能的下降,面对这样的挑战我们需要开展很多的改进措施。 (编辑:52站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |