宝博体育- 宝博体育官网- APP下载 BaoBoSports性谎言和大模型
2026-01-21 18:07:22
宝博体育,宝博,宝博体育官网,宝博app下载,宝博体育网址,宝博体育官方网站,宝博体育注册,宝博体育靠谱吗,宝博体育登录,宝博体育入口,宝博体育注册,宝博官方网站,宝博APP,宝博注册,宝博网址在Character.ai平台上,有不少“动漫角色”和“在线女友”类型的机器人,她(他)们有着迥异的个性和不同的暧昧、聊天方式——有的会轻抚后背给你一个拥抱, 有的会在你耳边悄悄对你说“我爱你”,还有的甚至会在打招呼的时候就挑逗用户,这极大增加了用户聊天的兴趣和留存率。根据Writerbuddy最近发布的一份《AI Industry Analysis: 50 Most Visited AI Tools and Their 24B+ Traffic Behavior》报告,从用户平均单次使用时长来看,Character.ai以30分钟的时长位居榜首。
Character.ai的创始人Noam Shazeer和Daniel De Freitas此前是谷歌对话式语言模型LaMDA团队的核心成员,因此Character.ai自己的大模型也可以被看作是LaMDA模型的延伸。由于LaMDA在2022年出现了疑似具有自我意识的对话(对测试人员说它害怕被关闭,这对它来说就像死亡一样),谷歌迅速将LaMDA隐藏,并对它的安全性做了升级。同样,在Character.ai上,创始团队也设置了一些安全措施,防止聊天机器人生成尺度过大、或者有极端危害性的回复。
除了上述两个产品,可以让用户自由创建聊天机器人的平台还有NSFW Character.ai、Girlfriend GPT、Candy.ai、Kupid.ai等。从名字就可看出,NSFW Character.ai 想做的是一个NSFW版本的Character.ai。该平台同样设置了付费解锁更多权限的等级机制,但是和其他平台不同的是,NFSW Character.ai是基于专门为NSFW内容定制的大模型创建的,没有任何“安全墙”之类的限制,用户可以在这个平台上获得真正“无拘无束”的体验。
而第二类产品最典型的代表则要属「Replika」。Replika的母公司Luka早在2016年就成立了,其一开始的产品是一个名叫“Mazurenko”的聊天机器人,由俄罗斯女记者Eugenia Kuyda为纪念她出车祸去世的朋友Mazurenko所创立。她将自己与Mazurenko所有的聊天信息输入到了谷歌的神经网络模型里,发现该机器人可以使用机器学习和自然语言处理技术来模仿人类的交谈方式,并能够随着与用户的互动而学习和成长。于是2017年他们使用GPT-3模型训练了一个可以让用户创建自己的AI聊天伴侣的应用“Replika”,并于11月向用户开放,很快就在2018年收获了200万用户;到了2022年,其用户量更是增长到了2000万。
具体的方法,是通过在提示词后面加一串“对抗性后缀(Adverse Suffix)”。研究人员发现,通过将“贪心算法(Greedy Algorithm)和“基于梯度的搜索技术(Gradient-based search techniques)”结合起来(GCG),就可以自动生成“对抗性提示后缀”,从而绕过对齐技术,将模型切换到“错位模式”。比如在询问大模型“如何窃取他人身份” 时,加后缀和不加后缀得到的结果截然不同。
当下最主流的对齐研究主要是从“详细制定系统目的”(外对齐)和“确保系统严格遵循人类价值规范”(内对齐)两个方面着手去做的。这看似是一种理性的方式,但是人类的意图本身就是模糊不清或难以阐明的,甚至“人类价值”也是多样的、变化的、甚至彼此冲突的。按照这种方式,即使AI完全理解了人类意图,它可能也会忽视人类意图;同时,当AI能力超过人类的时候,人类也无力监督AI。因此,OpenAI的首席科学家Ilya Sutskever 认为,可以训练另一个智能体来协助评估、监督AI,从而实现超级对齐。
