杨艺 Yang Yi
NLP Researcher · Multi-Agent Simulation · Stance Detection
深圳大学 计算机技术硕士在读(2027届)
🎓 教育背景
深圳大学
2024.09 – 2027.06
计算机技术 | 硕士(推免) | 研究方向:NLP、多智能体仿真、立场检测
广西师范大学
2020.09 – 2024.06
数据科学与大数据技术 | 本科
📝 学术论文
🚀 项目经历
SimBotPol:基于大语言模型的多智能体社交机器人网络极化仿真与干预评估框架
- 面向社交平台极化分析,搭建 LLM 驱动的多智能体仿真框架(角色设定 → 交互生成 → 指标统计 → 干预评估),在真实社交网络结构上模拟 1,800 个智能体(1,200 真人 + 600 机器人)交互,量化机器人对用户立场/情绪演化的影响
- 设计智能体决策引擎(7 类操纵策略 + 五大人格特质 + 双层记忆)与社交环境模拟器(发帖/转发/评论等),实现双层干预策略(个体认知反思 + 群体信息流调控);工程实现:Mesa + LLM + MySQL(日志与指标落库、可复现实验配置)
- 结果:复现回音室效应与群体极化;谣言传播型机器人显著推动负面情绪(情绪极化指数 +43%),影响力较定向攻击型高 28%;双层干预将极化水平降低 31%,成果整理投稿中
SPARK:基于大语言模型的多智能体对话生成与话题-立场协同演化仿真框架
- 提出话题-立场协同演化建模方案,解决既有方法对话中"话题漂移/扩展"与"观点更新"割裂的问题;联合模拟 108 个智能体在 5 个领域开展多轮对话交互,实现个体可追踪、群体可量化的仿真与分析
- 构建立场感知智能体模块(个性化角色 + 双层记忆 + 反思式立场更新)与话题演化模拟器(话题树动态扩展 + 传播路径追踪),实现单次仿真生成 10,000+ 对话轮次并输出结构化统计指标;工程实现 Mesa + LLM + MySQL(实验日志/指标统计)
- 结果:量化验证话题与立场强耦合(相关系数 0.88);科技话题创新速度较科学/医疗高 22.7%;易受影响人格的话题新颖性较稳定人格高 22.7%
- 代码开源:[Code]
C-MTCSD:中文多轮对话立场检测数据集构建与基准评测
- 针对中文多轮对话语义理解中上下文依赖与隐式立场难点,构建大规模中文多轮对话立场检测数据集;从微博采集 5 个热点话题,完成 24,264 条实例标注(最深 6 轮),规模为同类中文数据集 4.2 倍
- 设计三阶段数据处理流水线与双人标注 + 专家复审机制,标注一致性达 0.972;实现 12 个模型全量评测(传统深度学习/预训练模型/对话专用模型/大语言模型),并按对话轮次/深度分析性能衰减规律(评测脚本与统计分析可复现)
- 结果:零样本场景下最优模型 GPT-4 平均 F1 为 64.07%,传统模型在隐式立场检测中 F1 低于 50%;发现对话深度每增加 1 轮性能平均下降 6.2%,最高衰减达 37.2%
- 数据开源:[Data]
🛠️ 专业技能
NLP:语义理解与文本分类、立场检测、多轮对话建模、NLU、对话状态跟踪、对话策略
深度学习与 LLM 工具链:PyTorch、Prompt Engineering、LLM Agents(记忆/反思/可控生成)
工程与数据:Python、MySQL、Linux、Git;数据处理流水线与实验复现(配置管理/日志/统计分析)
🏆 荣誉与奖项
学业奖学金
- 深圳大学硕士研究生学业奖学金一等奖(2025)
- 深圳大学硕士研究生学业奖学金特等奖(2024)
国家级竞赛
- 第16届全国大学生计算机设计大赛三等奖(2023)
省级竞赛
- 第五届广西高校计算机设计大赛一等奖(2023)
- 第十四届蓝桥杯全国软件与信息技术人才大赛三等奖(2023)
- 第十三届蓝桥杯全国软件与信息技术人才大赛二等奖(2022)
- "桂林银行杯"数据建模大赛暨全国大学生数学建模大赛预赛优秀奖广西赛区(2022)
- 中国大学生程序设计大赛(阶梯竞赛)三等奖广西"华山讨论组"(2022)
- 第四届传智杯全国IT技能大赛编程赛道三等奖(2021)