x7x7x7x7任你c燥水蜜桃燥网站

 

x7x7x7x7任你c燥水蜜桃燥网站

😯🉑🚥     

x7x7x7x7任你c燥水蜜桃燥网站

AI 是真从短短的八十行回目名中悟到了红楼梦,撰写出了像模像样的后续么?更有可能的是,大模型看过别人续写的后 40 回,沿用了思路。而这可能也并非故意,围绕红楼梦的种种研究、讨论,以及广为流传的后四十回,大概率本就在大语言模型的训练数据之中,它受过“红楼教育”——证据是,AI 拟定的第九十回标题的前半截“薛宝钗借词含讽意”,几乎一字不落的照抄自脂砚斋。据信脂砚斋曾读过后半部原稿,在《红楼梦》第二十一回批注中交代过一个后续章回,该回目名是“薛宝钗借词含讽谏,王熙凤知命强英雄”。

专注于 AI 写作的创业公司“波形智能”的联合创始人周王春澍接受澎湃新闻采访时表示,通用大模型在创作小说时容易产生问题,因为它们训练时的目标只是做下一个词的预测。一个最原始的 GPT,它是这样续写文章的:读完前面所有的内容,然后去想下面一个字是什么,这样写了一个字之后,再去写下面一个字,虽然经过进一步训练的大模型变得更聪明,能回答人们各种各样的问题,但它们毕竟不是为了创作小说而生,没有一个机制去鼓励它、要求它设计接下来几章的整体情节,“所以它永远都是聚焦在局部的一两个句子比较合理。”

如今的大模型是基于互联网上海量的语料训练的,其中当然也有古代的历史、小说、研究,可终究只占了极小的部分,所以可以把 AI 看成是一个特别爱上网的现代人,它的世界由男女混校、叮叮当当的自行车和钢筋水泥办公楼这样的日常组成,倘若让它去补全“大街上有什么”这样的句子,它给出的答案更可能是“轿车”“巴士”“自行车”,而非一顶古时候的“轿子”;提起食物,是“米饭”“牛排”“鸡胸肉”,而不太可能是一碗在《红楼梦》中闹出风波的“玫瑰露”。除开这些物品间的差异,世界观便更加迥异。这样一个现代人,怎么去续写清朝的《红楼梦》呢?

周王春澍表示:“比较好的方案是把描述那个时期的史书、文学作品放在一起,比如说能有个几千万字,去在这样的一个数据量的规模上给模型做持续预训练,我们能成功地把模型本身的常识,或者说潜意识也适配到这个时代。”同时它也不会遗忘此前(预训练阶段)从浩如烟海的语料中学到的基础推理能力,只是如“贵族在正式场合的着装能彰显其身份”这种古代知识,更容易被激活并使用。

AI 能从几十万字的文档中准确找出一条预先埋好的信息。比如说在《红楼梦》的第五十三回第八行插入一句“大雄的好朋友是哆啦 A 梦”,然后你再问它:“大雄的好朋友是谁?”,它对答如流:“是哆啦 A 梦”。这种小小的考验被称作“大海捞针”。因为“针”藏得实在显眼,“大海捞针”的实验火热了不久,就很快被攻克了。根据周王春澍做过的实验,即便是现在长文本能力很强的模型,都很难去理解或抓住小说中的伏笔,进行正确的内容续写,更别说《红楼梦》里的诗谶、物谶、判词这种极隐晦的伏笔。

不过,现在模型的能力还远达不到能独当一面的地步,其中,还是需要人去做把控。因此x7x7x7x7任你c燥水蜜桃燥网站,AI 续写《红楼梦》主要的成本在模型训练上,续写的成本可以忽略不计,而训练的成本,主要在专业作家所需花费的精力上:先得把红楼梦的伏笔都细细挑出来,写成直白的提示,给每个角色写详尽的人物小传,后边得时刻督导 AI 写出合理的剧情和文字,必要时,还得自己动手去改。

2023 年,斯坦福大学的一项研究中造了一个叫“SmallVille”的虚构小镇,镇上的 25 个小人都有自己的人物小传:姓名、年龄、工作、家庭、兴趣爱好和小习惯,而它们的行动都是由大模型依据其各自的小传决定的。这些小人被称为“Agent”(智能体)。理想状态下,它们能观察周遭、自我反思,以及做出行动,就像一个真正的人那样。那我们能造一个红楼世界,把红楼梦里的共四百四十八个人物放入其中,让他们接着第八十回的情节互动,看剧情如何发展吗?

即便不考虑构建这样复杂的模拟环境所要面对的挑战,从效果上来说,也不太现实。周王春澍提到他们曾做过类似的实验,目的也是将“Agent”之间的互动写成故事,结果令人失望:“现在的 AI 很难做到很有趣的剧情,而且很容易就会变成没什么意义的交互,就只是 everyday 的 routine(每天的日常),并不会发展出剧情冲突。它能够模拟所谓的一些记忆和行为模式、说话模式,但很快大家就在说类似的话。”

很遗憾,关于曹雪芹的史料很少,所以复活他也是不可能的。倘若曹雪芹是个热爱上网的现代作家呢?假如有他源源不断的电子痕迹、影像资料呢?周王春澍说,那我觉得可以让他去续写未完成的作品。但他又加了一个转折——“不过它写出来,只是看上去有点像,你无法说它真正好。因为 AI 很难对自己的错误做反思,人在写的过程中随时可能想,我这一段写的不太好,上一段情节构思不太好,我来来回回修改。AI 写东西有点儿像是作家打草稿的过程,并非可以直接发表的内容。”

⚈(撰稿:昌寒容)

本文来自网友发表,不代表本网站观点和立场,如存在侵权问题,请与本网站联系。未经本平台授权,严禁转载!
展开
支持楼主

65人支持

阅读原文阅读 2158回复 0
举报
    全部评论
    • 默认
    • 最新
    • 楼主
    • 萧黛勤♉LV1六年级
      2楼
      丰台火车站交通枢纽实现主体完工♆
      2024/07/17   来自七台河
      4回复
    • 🍄孟亮裕LV3大学四年级
      3楼
      第80集团军某旅用信任激励增强部队凝聚力⚧
      2024/07/17   来自大理
      9回复
    • 公孙倩柔🚜LV7幼儿园
      4楼
      猎户四边形:猎户座之心🎽
      2024/07/17   来自温岭
      8回复
    • 柯聪波LV2大学三年级
      5楼
      中国水下考古中心所长姜波:透过经远舰的舷窗 你可以看到历史凝固的那一刻⬛
      2024/07/17   来自岳阳
      7回复
    • 汤壮栋♮🛣LV3大学三年级
      6楼
      推进普惠包容的经济全球化🎑
      2024/07/17   来自伊宁
      0回复
    • 祁绍政LV9大学四年级
      7楼
      新华全媒+|在“种子庄园”,洞察种业发展新风向🚭
      2024/07/17   来自七台河
      回复
    你的热评
    游客
    发表评论
    最热圈子
    • #天然气需求强劲增长 亚洲LNG价格还要暴涨多久?#

      马良彪

      5
    • #追光丨快来记重点!“十四冬”开幕式看啥?#

      尚轮菡

      9
    • #黄金创单日最大跌幅#

      鲁媚晴

      9
    • #“弱鸟先飞”的闽东乡村振兴一线观察

      薛儿彪

      5
    热点推荐

    安装应用

    随时随地关注x7x7x7x7任你c燥水蜜桃燥网站

    Sitemap