金一帆|拟态环境视域下智媒AI幻觉的生成逻辑与应对路径

拟态环境视域下智媒AI幻觉的生成逻辑与应对路径

金一帆

安庆师范大学传媒学院

摘要:随着生成式人工智能技术的快速发展,ChatGPT、Sora等模型推动新闻生产智能化转型,但在高效与便捷的背后,AI幻觉风险日益凸显。本文立足拟态环境视域,从媒介信息环境与真实信息环境的关系出发,系统阐述新闻智能化生产中AI幻觉生成的三重逻辑,提出构建融合技术与人文价值的应对路径,旨在为新闻业在智能化转型中有效规避AI幻觉风险、构建真实健康的信息环境提供理论参考。

关键词:AI幻觉;拟态环境;新闻智能化生产

自2022年ChatGPT问世,其凭借文生文功能、流畅自然的对话交互和强大的文本生成能力,改变了人们对内容创作的认知。2023年,文生图技术迅速发展,DALL·E3、Midjourney、StableDiffusion等模型崭露头角。只需简单的文字描述,就能生成风格各异的精美图像,让创作者将奇思妙想转化为直观的视觉形象。2024年,OpenAI发布文生视频大模型Sora,为内容创作领域带来革命性突破。借助简单的文字关键词提示,Sora能在短时间内生成时长达一分钟的视频,为创作者带来前所未有的创作体验。2025年,DeepSeek问世,用户安装后即可与DeepSeek-V3模型互动。凭借透明、可解释的深度思考过程,打破了人们对AI生成内容“知其然而不知其所以然”的认知局限,为AI应用开拓了新的发展方向。

生成式AI在新闻行业得到广泛应用,为内容生产带来了智能化实践,但也造成了AI幻觉的风险。除了技术本身的缺陷外,在新闻传播领域,AI幻觉所生成的错误信息,不仅会影响新闻内容的真实性与准确性,还会误导公众对现实客观世界的认知与理解。新闻媒体作为信息环境的重要构建者,若在生产传播过程中夹杂虚假信息,将引发信息环境与现实环境之间的冲突与矛盾,削弱媒体的公信力。

一、文献综述

随着科技快速发展,AI幻觉(AIhallucination)现象逐渐进入大众视野,引发广泛关注与思考。Bubeck,Sébastien等学者指出,AI幻觉是大语言模型(largelanguagemodel,LLM)在未加限制的情况下,将错误的引用、内容、陈述与正确信息交织在一起,以具有说服力的方式呈现,难以在缺乏仔细检查与事实核查的情况下被识别。由此可见,AI幻觉极为隐蔽且具有强大的欺骗性。经羽伦等学者从媒介欺骗性出发,深入探讨生成式AI幻象的制造逻辑及其后果,认为在生成式AI中出现的错误生成、虚假再现等具有欺骗性质的现象,统称为“生成式AI幻象”。YejinBang等学者将AI幻觉划分为内在幻觉(intrinsichallucination)与外在幻觉(extrinsichallucination),内在幻觉指语言模型生成的内容与输入内容相矛盾,是模型自身生成的,而非基于输入信息的合理推断或扩展;外在幻觉指语言模型生成的内容无法从输入数据中得到验证或支持,是模型自身生成的、与输入无关的虚假信息。在缺乏批判性思考的情况下,AI幻觉将进一步放大知识生成过程中错误与不准确信息带来的危害。

20世纪20年代,新闻学者沃尔特·李普曼(WalterLippmann)提出,拟态环境是大众传播媒介通过对信息进行选择、加工、整理和传播而构建出来的虚拟信息环境。在基于AI技术的大语言模型时代,拟态环境则是通过人工智能的机器学习方式,对海量信息进行整理与学习后输出形成,其本质是一种“智能拟态环境”的建构方式。随着大模型与用户的交互,“智能拟态环境”也在不断更新迭代。

二、AI幻觉在新闻智能化生产中的生成逻辑

(一)拟态环境与AI训练的交互影响

拟态环境作为媒介精心构建的“象征性现实”,其形成过程依赖于媒介对海量信息所进行的筛选、甄别与深度加工。随着新闻智能化生产的兴起,AI模型逐渐成为新闻生产的重要工具。AI模型的训练依赖大规模的数据收集,这些数据来源广泛,涵盖互联网上的文本、图像、音频等多种形式。不同信息源自不同主体,而每个主体对客观世界的认知各有侧重,由此形成的多元拟态环境与AI训练之间产生了直接关联。AI生成式内容实质上是对拟态环境的再次重构,其内容的真实性与客观性难以有效把控。

在AI训练过程中,新闻媒体机构对“什么信息值得关注”的优先级判断,成为AI生成新闻的逻辑之一。在浩如烟海的训练数据中,若某一类新闻事件被高频次呈现,AI模型基于其算法逻辑和数据学习机制,会将其视为普遍存在且具有广泛代表性的现象。因此,当AI模型生成新闻内容时,会不自觉地过度强调或放大该类事件的重要性和影响力。例如,在一些训练数据中,高频出现的明星丑闻被判定为“重要”,而其他低频议题则被边缘化;数据中强关联的标签组合如“科技公司+创新”被固化为因果关系。媒体报道的固定结构等内容被AI模型学习后,导致生成内容趋于模式化。这种AI模型生成内容的偏差,其影响是多维度且深远的。一方面,AI模型所依据的训练数据本就承载着拟态环境的“基因”,而模型生成内容中的偏差又进一步强化了这种特征,由此形成自我强化的恶性循环。另一方面,这种偏差会进一步扭曲拟态环境的发展方向。受众在接收经过AI模型“加工”的新闻内容时,往往会受到潜移默化的影响,进而对现实世界的认知产生异化。

(二)数据模糊性与算法黑箱的双重作用

在人工智能领域,与“幻觉”相对应的概念包括“事实性”和“忠实性”。大语言模型以固有模式识别生成内容,而非基于事实逻辑进行推理。以ChatGPT为代表的大语言模型,其基础架构GPT(生成性预训练转换器,GenerativePre-trainedTransformer),是一种基于Transformer网络的自然语言处理模型。相较于其他深度学习的神经网络,GPT借助多层自注意力机制(self-attention)和前向神经网络(feed-forwardneuralnetwork),能够精准计算序列中各词句之间以及各位置之间的关联,并有效捕捉上下文信息。通过对海量文本数据进行学习,分析语言模式、词汇搭配、语法结构等信息,在模型中建立起相应的知识表征。当接收到输入指令时,模型会根据学习到的模式,从概率角度选择合适的词汇和语句生成回复。基于模式识别的方式虽能在一定程度上生成连贯、通顺的文本,但本质上是通过判断和预测人类语言表达的概率,实现对人类语言能力的模拟。

生成式AI缺乏对事实的深入理解和逻辑判断能力,无法自主辨别事实真伪、是非曲直与公平正义,这为AI幻觉的产生埋下了伏笔。大语言模型依赖海量文本训练,而这些数据本身具有模糊性,主要表现在三个方面。一是覆盖盲区,训练生成式AI的原始数据无法穷尽所有领域、事件与知识,尤其在涉及新兴领域、细分专业或罕见事件时,AI生成的内容难以满足用户对深度、准确信息的需求;二是语境缺失,大语言模型所使用的训练数据在收集和整理过程中,为了便于处理,将其从原始语境中剥离出来,导致文本孤立呈现,模型在学习过程中难以获取完整的语义信息,导致对语义的理解出现偏差;三是数据偏见与不平衡,部分观点或事件因受到更多关注、报道或记录而在数据中被过度代表,而另一些则因缺乏相关记录或被人们忽视,在数据中占比极小甚至被完全忽略。这种偏见与不平衡,即便通过人力筛选与标记,面对海量数据集而言也不过是杯水车薪,甚至可能在人力干预下出现结构性错误。

(三)媒介生产流程的自动化加速幻觉传播

新闻智能化生产的目的在于提高内容产出效率,借助AI技术快速生成新闻初稿。这一生产模式在一定程度上满足了公众对信息及时性的需求,但也暴露出新的问题。由于追求速度,AI生成的初稿会在未经严格事实核查的情况下进入传播链条,甚至为了博取关注而“制造”新闻。例如,2023年4月,德国某杂志利用AI技术杜撰了对“车王”迈克尔·舒马赫的“独家访谈”,其采访视频为AI合成,最终出版商向当事人致歉,杂志主编被解雇。在流量至上的商业逻辑驱动下,国内短视频平台也曾出现AI生成的“老人倒地讹诈”“明星私密对话”等博眼球内容,单条虚假视频播放量动辄突破百万,造成了负面影响。

算法技术快速发展,新闻业正面临前所未有的挑战。虚假新闻只是AI生成内容中的一部分,AI“深度伪造”技术正日益模糊真实与虚假的边界。当受众难以凭借感官经验辨别信息真伪时,社会的认知体系将面临被污染的风险。如何在技术创新与内容质量之间找到平衡点,构建覆盖AI新闻全生命周期的监管框架,成为提升新闻业公信力的重要命题。

三、构建拟态环境与真实世界的动态平衡路径

(一)优化数据生态与算法透明度

为减少大语言模型在训练数据上的偏差,应着力构建全面、多源、多模态的新闻语料库。确保数据的准确性与可靠性,借助区块链技术记录数据来源与修改痕迹,有效保障训练集的可追溯性。以路透社“新闻数据链”项目为例,该项目为每篇AI生成稿件标注“数据指纹”,相当于为数据赋予独一无二的身份证。一旦数据出现问题,可迅速追溯至源头及各环节的修改记录,从而及时对有问题的数据进行清洗与修正,保障数据的真实性与可信度,这种动态清洗机制不仅能有效防止错误数据进入训练集,还能增强数据的安全性和完整性,使数据在整个生命周期内都处于可监控、可管理的状态。单一地域、文化及立场所产生的数据会导致模型认知的片面性。因此,应积极引入多语言数据,涵盖全球不同地区的语言表达与文化。同时,增加对小众群体的报道,使模型能够接触到多样化的社会现实。通过这些举措,增强模型对社会现实的认知能力,使其生成的内容更贴近真实世界。

此外,对AI输出标注可靠性等级,如“高置信—经多源验证”“低置信—需人工复核”,让用户第一时间了解AI生成内容的可信度。对于低置信度内容,用户及时进行人工复核,避免因错误信息传播造成不良影响。这种分级提示机制在提升用户使用体验的同时,也降低了虚假信息传播的风险,使AI技术在内容生成领域更加可靠与实用。

(二)嵌入事实核查与可信信源机制

检索增强生成(RAG)技术,能够提升AI生成内容的准确性与可靠性,在新闻生成等领域,其作用尤为突出。传统AI生成内容往往依赖于模型自身的训练数据与模式识别能力,在面对未被充分训练的专业问题时会回应虚构或错误答案。RAG技术通过强制接入新闻机构稿件库、学术期刊等权威数据库,为AI提供坚实的事实基础。这些权威数据库经专业人员审核与整理,具有较高可信度与准确性。AI在生成新闻内容时,不再仅依靠“猜测”或概率推断,而是从权威数据库中检索相关信息作为依据,从而限制自由发挥的空间,减少虚构与错误信息产生。

双重验证系统是一种有效的事实核查与可信信源机制。谷歌“双子星”所采用的绿标与棕标分类机制是典型代表。该系统结合人工编辑复核,建立内容可信度分级体系,为用户提供明确的内容质量参考。在谷歌“双子星”系统中,AI生成内容后,会通过自动化算法进行初步评估,判断其可信度。对于评估认为可信度较高的内容,标记为绿标(已验证),表示其在一定程度上经过验证,具有较高可信度;对于算法评估存在疑问的内容,则标记为棕标(存疑),提示用户该内容可能存在不准确或不可信之处。除了自动化算法评估外,人工编辑复核环节同样重要。专业编辑对棕标内容进行详细审查,借助专业知识与经验,进一步核实其真实性与准确性,判断是否存在错误、偏见或其他问题。通过双重验证,确保内容的可信度,减少虚假信息与错误内容传播。这种双重验证机制不仅在搜索引擎和信息推荐领域具有重要应用价值,还能推广至其他内容生成与传播平台,为用户提供可靠的信息来源,帮助其在海量信息中辨别真伪,提高信息获取的效率与质量。

(三)重构人机协同的生产流程

预生成阶段是引导与规范AI生成行为的首要环节。编辑应设定“伦理边界规则”,引导与规范AI生成行为。在多元复杂的社会环境中,AI算法的伦理问题至关重要。应明确禁止生成暴力、低俗等不良内容,为AI的生成行为划定界限。同时,借助强化学习对模型行为进行约束,根据设定的规则与目标对模型输出进行评估与反馈,对符合规则的内容给予奖励,反之则给予惩罚,从而引导模型逐步学会在规定的伦理范围内进行内容生成。这一阶段的工作可为后续内容生成奠定正确的方向与道德基础。

后生成阶段是确保内容质量的重要把关环节。应采用“双盲审核”机制,即AI生成的内容必须经过另一独立模型的交叉验证。两个模型相互独立,各自基于自身算法与知识体系对内容进行评估,从而避免单一模型可能存在的局限性与偏差。通过交叉验证,发现内容中存在的逻辑错误、事实性错误或其他不合理之处。随后,内容再提交人工进行终审。人工终审环节不可或缺,因为人类具有独特的判断力与情感理解能力,能够对内容进行更细致、全面的审查。尤其是对于涉及价值观、情感倾向和文化背景的内容,人工审核能够确保其符合社会的普遍认知与道德标准。

四、结语

智能技术的迅猛发展,使拟态环境与AI技术深度交织,形成了复杂的社会图景。拟态环境由媒介对现实的选择性加工所构建,AI技术的介入,叠加产业化主体的多元参与,使其塑造逻辑进一步复杂化。AI在内容生成过程中隐含着算法逻辑与潜在操控,重塑了拟态环境的形态,导致人们的认知与价值判断出现偏差。在拟态环境与AI幻觉的双重作用下,人类的主体性被削弱,用户长期暴露于算法筛选的信息之中,其认知与决策在无形中被技术牵引。但人们应该明确,拟态环境是现实的映射,AI幻觉无法脱离人类设定的框架而存在。对此,我们既不能一概否定,也不应盲目推崇,而应将其置于社会文化语境中加以辩证审视。一方面,AI为拟态环境注入了新的活力,丰富了信息的表现形式,为创意产业与知识探索拓展了空间;另一方面,若任由AI幻觉无序渗透,则会引发虚假信息泛滥,加剧认知偏差。因此,我们应以开放包容的态度吸纳其积极价值,借助柔性监管,规范技术应用,加强媒介素养与AI素养教育,提升公众的辨识能力;同时,坚守人的主体性核心地位,主动防范拟态环境与AI幻觉带来的价值异化风险,使技术真正服务于人,共同构建真实、健康的信息环境。