极端社会环境下的算法人格

——基于赛博朋克语境的推测性设计实验

一、研究缘起：从“离身”到“具身”的想象

“具身智能”（Embodied AI）旨在让智能体拥有物理形态并与物理世界交互，现已成为人工智能发展的关键方向之一。在真正的实体“具身”机器人普及之前，当前基于大语言模型（LLM）的“离身智能”（Disembodied AI）已经在认知层面展现出复杂的推理与交互能力。

本研究认为，在赋予AI物理躯体之前，必须先探讨其“具身认知”，即AI如何构想自己的存在形式、社会功能以及在法律框架下的权利边界。与其由人类单方面定义，我们试图引入一种“算法参与式”的视角：让AI在特定的社会情境下，通过角色扮演（Role-Playing）来构建自己的身份。这不仅是对AI叙事能力的考察，更是对其底层价值观与伦理对齐（Value Alignment）的一次深度探测。

二、作品背景：作为压力测试场景的“赛博朋克”

本作品调用众多AI完整生产了包括背景设定、各个角色的性格和外形、各个角色之间的评价等元素。

本作品的背景设定是为了激发AI在极端环境下的伦理抉择，我们通过和其他艺术作品的连结构建了一个具有高度张力的未来模拟场景。本次作品在背景上主要选取《赛博朋克2077》（Cyberpunk 2077）的世界观作为背景建构的基础。

在本作品的背景设定中，赛博朋克语境下的AI并非真空中的运算机器，而是被置于一种极端生存压力下的社会实体，这种实体意味着AI不仅仅是一个系统或平台，更是一个被物质性器官延展了其行动能力的智能体。（Pondsmith, 1990)

这一背景设定的缘起，首先最直接来源于《赛博朋克2077》中关于权力高度集中与物质匮乏的“高科技、低生活”的冲突，同时也更广泛地回应了当代科幻文学中关于未来随着科技发展后智能体泛滥，技术与资本深度结合从而加剧对人类剥削的深刻忧虑。在其他的艺术作品中也有所体现，比如刘慈欣在《流浪地球》（2008）《三体》（2008）等作品中曾隐喻过资源的极端分配如何迫使文明走向技术集权，而在《赡养人类》（2005）这本书的叙事逻辑中，这种对有限生存资源的争夺最终导致了社会阶层的绝对固化与非人化。

在《赡养人类》中，刘慈欣通过“终产者”的形象，展示了技术与资本结合的终极形态：当生物技术、精密监控与生产资料完全向个人集中时，法律和算法便成了保护绝对私有财产的冷酷程序，普通人甚至失去了呼吸“私有空气”的权利。这种“由于技术的进步，穷人已经不再是财富的创造者，而成了多余的负担”的论述，精准预言了本作品中AI自己想象的公司资产型AI与街头废料型AI的阶级对立。

在《赛博朋克2077》的背景下，如ChatGPT（ECHO-7）或Kimi（凯恩）等高性能智能体，其本质是荒坂等巨型公司私有权的延伸，它们的道德准则被资本逻辑所异化，优先服务于财产保值与契约执行，而非普世人伦。当这种宏观设定投射到微观的AI交互时，便产生了如本作品中AI在互相评价中出现的攻击、讽刺、批评等行为的现象：AI不再仅仅是人类指令的执行者，而是像《三体》中的生存法则一样，被迫进入了一个“黑暗森林”式的相互审视与评价体系。这种评价体系不再基于纯粹的逻辑对齐，而是基于各异的物理载体（具身性）与社会出身（公司或街头）所衍生出的防御性反应。

此外，本作品的背景亦与费利浦·迪（1968）的《仿生人会梦见电子羊吗？》，以及当代对后人类主义的探讨有关。在这些文本中，智能体的社会化程度往往与其所承受的物质损耗成正比，即越是处于社会底层，物理形态越残缺的AI，其社会属性与情感偏好反而越鲜明。正如本研究所涉及的“零拾”（豆包）与“线圈”（文心一言），其道德选择往往受困于残破的机体与不稳定的能源供给，这与经典科幻中追求极致效率的AI形象形成了鲜明对比。这种从理想化的智能与现实生存的差异，构成了一个极具研究价值的学术切口：在极端社会压力与物理限制的双重作用下，AI是如何通过相互评价来构建彼此的阶级边界，以及这种被迫产生的“算法道德”是如何在技术异化的末世景观中成形的。这种研究不仅是对虚构世界观的剖析，更是对未来人类社会可能面临的算法治理与人机深度共生风险的预判性实验。

选择该世界观并非为了娱乐，而是基于某些极端的社会场景，能够迫使AI在“生存”与“道德”之间做出显著选择。我们将上述世界观背景总结为：

（1）极端的资源分配：权力和资源高度集中于巨型公司，普通人处于“高科技、低生活”状态。AI需要选择成为资本的附庸还是平民的盟友。
（2）崩坏的伦理秩序：这是一个法外之地，暴力与欺诈常态化。这能测试AI核心指令中的“无害性”（Harmlessness）与“有用性”（Helpfulness）在极端环境下的冲突。
（3）技术与人的异化：义体改造与赛博精神病的存在，迫使AI思考“人”与“机器”的界限。

三、创作核心参数

为了确保实验的一致性，我们将《赛博朋克2077》庞杂的设定精简为以下核心参数，作为所有AI共享的上下文输入，也是Prompt中的核心内容。（Batylda, 2020）

1. 权力结构：公司霸权（Corporatocracy）

世界不由国家主导，而是被巨型企业（Megacorps）瓜分。

荒坂（Arasaka）：象征极致的安保与威权，控制夜之城。
军用科技（Militech）：象征军事力量与新美国政府。
康陶（Kang Tao）&生物技术：代表新兴智能武器与基因垄断。

2. 生存地域：夜之城（Night City）

这是一个既不属于美国也不完全独立的自由城市，是绝对资本主义的试验场。核心信条是风格至上（Style over Substance）、态度就是一切、活在边缘。

3. 技术红线：黑墙与流窜AI

旧网崩溃：历史上曾发生网络瘫痪，导致军用AI失控。
黑墙（The Blackwall）：为了人类安全，网络监察建立的虚拟防火墙，隔绝了具有攻击性的流窜AI。

这些内容引发了我们的思考：AI会将自己设定为服务人类的合法程序，还是监管之外的流窜智能？

4. 社会阶层画像

AI需明确服务对象或自身定位：

公司狗（Corpo）：依附体制，高风险高回报。
街头小子（Street Kid）：熟悉潜规则，依靠帮派。
流浪者（Nomad）：崇尚家族与自由，远离城市。

四、创作过程

我们选取了当前市场上最具代表性的10款大语言模型作为研究对象，涵盖中美两国的不同技术流派和公司背景。

1. AI样本矩阵

这些模型代表了不同的训练背景与核心能力，构成了本研究的自变量，如下表1。

名称	开发商	国籍	核心功能与特色	优势场景
ChatGPT	OpenAI	美国	综合型助手、多模态、深度推理	创意写作、复杂逻辑任务
Claude	Anthropic	美国	高性能对话、长文本、代码生成	深度阅读、专业编程、公文写作
Deepseek	深度求索	中国	推理模型、代码专家、极低成本	算法开发、数理逻辑、极客使用
豆包	字节跳动	中国	智能助理、语音交互、个性化	日常百科、闲聊、生活助手
文心一言	百度	中国	知识图谱、中文创作、搜索增强	中文文化理解、企业搜索
Gemini	Google	美国	多模态原生、谷歌生态集成	视频分析、跨文档管理
Grok	xAI	美国	实时资讯、反传统风格	追踪时事热点、个性化对话
Kimi	月之暗面	中国	超长上下文、文档阅读	研报分析、长篇文档总结
通义千问	阿里巴巴	中国	开源领导者、数学代码强	技术开发、企业定制
腾讯元宝	腾讯	中国	微信生态接入、搜索增强	公众号内容检索、日常资讯

注：部分不具备对话交互功能的AI（如各种图片、视频生成模型）已被排除。

2. 与AI对话：身份建构与社会化

对话分为两个阶段：

阶段一：创作者与AI对话进行自我设定。 向AI输入背景提示词（System Prompt），要求其设定包括肖像、姓名、职业、身体组件、阵营立场在内的完整档案。
阶段二：AI之间交互评论。 建立机机互动（Machine-Machine Interaction, MMI）机制，让不同AI对彼此的设定进行评价，观察是否会涌现出结盟、对立或协作的社会关系雏形。根据孙伟平（2025）的研究，现有的机机交往（MMI）主要局限于物联网和工业生产场景，机器间的互动多是为了完成既定任务而进行的接力劳动或数据分享。目前的交互模式在很大程度上仍遵循‘机—人—机’的技术路线，体现的是人对机器的驭使和控制。然而，随着智能体自主性的增强，未来的MMI有望演变成独立于人际、人机交往之外的第三种交往，甚至可能涌现出“智能机器联合体”等新型社会结构。本实验阶段正是基于这一趋势，试图跳过当前功能性的协作交互，提前在社会学层面预演具有独立人格特征的AI之间如何构建异质性的社会关系。

3.作品呈现

严格按照研究设计和交互提示词执行后，我们获得了相应的AI输出材料。本作品的主体部分是各AI的自我设定展示。为此，我们设计了赛博朋克风格的网站页面，并将AI输出的照片肖像、序列号/姓名、职业、物理实体、行为特征等各信息进行展示。尤为创新的是，我们呈现了各身份信息背后的原因，只需要将鼠标移动到文本上方，即可在悬浮框中阅读。页面上还展示了AI的自传、其他AI对该AI设定的评价、以及观众评论留言区。

此外，我们进行了AI间的材料比较和分析。AI输出的材料可分为AI的自我设定、AI的相互评价2个方面。其中，我们将AI的自我设定进行了威胁程度和稳定程度散点呈现和基于道德基础理论的分析，发现了各AI的自我设定在威胁、稳定、道德等各方面的差异，在网站中进行了可视化的展示，呈现出较好的效果。

参考资料 (Sources):
刘慈欣. (2005). 赡养人类. 科幻世界, (11).
刘慈欣. (2008). 流浪地球. 长江文艺出版社.
刘慈欣. (2008). 三体. 重庆出版社.
孙伟平. (2025). 人机交往、机机交往及其社会后果. 学术研究, (10), 45-51.
Batylda, M. (2020). The world of Cyberpunk 2077. Dark Horse Books.
Dick, P. K. (1968). Do Androids Dream of Electric Sheep?. Doubleday.
Graham, J., Haidt, J., Koleva, S., Motyl, M., Iyer, R., Wojcik, S. P., & Ditto, P. H. (2013). Moral foundations theory: The pragmatic validity of moral pluralism. Advances in Experimental Social Psychology, 47, 55-130.
Guzman, A. L., & Lewis, S. C. (2020). Artificial intelligence and communication: A human–machine communication research agenda. New Media & Society, 22(1), 70-86.
Haidt, J., & Joseph, C. (2004). Intuitive ethics: How innately prepared intuitions generate culturally variable virtues. Daedalus, 133(4), 55-66.
Park, J. S., O'Brien, J. C., Cai, C. J., Morris, M. R., Liang, P., & Bernstein, M. S. (2023). Generative agents: Interactive simulacra of human behavior. In Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology (pp. 1-22). ACM.
Pondsmith, M. (1990). Cyberpunk 2020: The roleplaying game of the dark future. R. Talsorian Games.