杨艺 Yang Yi | NLP Researcher

🎓 教育背景

深圳大学 2024.09 – 2027.06

计算机技术 | 硕士（推免） | 研究方向：NLP、多智能体仿真、立场检测

广西师范大学 2020.09 – 2024.06

数据科学与大数据技术 | 本科

EMNLP 2025 CCF B 共同一作
SPARK: Simulating the Co-evolution of Stance and Topic Dynamics in Online Discourse with LLM-based Agents [Link]
WWW 2025 CCF A 共同一作
C-MTCSD: A Chinese Multi-Turn Conversational Stance Detection Dataset [Link]

SimBotPol：基于大语言模型的多智能体社交机器人网络极化仿真与干预评估框架 项目负责人 | 2025.07 – 至今 | 在研

面向社交平台极化分析，搭建 LLM 驱动的多智能体仿真框架（角色设定 → 交互生成 → 指标统计 → 干预评估），在真实社交网络结构上模拟 1,800 个智能体（1,200 真人 + 600 机器人）交互，量化机器人对用户立场/情绪演化的影响
设计智能体决策引擎（7 类操纵策略 + 五大人格特质 + 双层记忆）与社交环境模拟器（发帖/转发/评论等），实现双层干预策略（个体认知反思 + 群体信息流调控）；工程实现：Mesa + LLM + MySQL（日志与指标落库、可复现实验配置）
结果：复现回音室效应与群体极化；谣言传播型机器人显著推动负面情绪（情绪极化指数 +43%），影响力较定向攻击型高 28%；双层干预将极化水平降低 31%，成果整理投稿中

SPARK：基于大语言模型的多智能体对话生成与话题-立场协同演化仿真框架 核心开发者 | 2025.02 – 2025.06 | EMNLP 2025 共同一作

提出话题-立场协同演化建模方案，解决既有方法对话中"话题漂移/扩展"与"观点更新"割裂的问题；联合模拟 108 个智能体在 5 个领域开展多轮对话交互，实现个体可追踪、群体可量化的仿真与分析
构建立场感知智能体模块（个性化角色 + 双层记忆 + 反思式立场更新）与话题演化模拟器（话题树动态扩展 + 传播路径追踪），实现单次仿真生成 10,000+ 对话轮次并输出结构化统计指标；工程实现 Mesa + LLM + MySQL（实验日志/指标统计）
结果：量化验证话题与立场强耦合（相关系数 0.88）；科技话题创新速度较科学/医疗高 22.7%；易受影响人格的话题新颖性较稳定人格高 22.7%
代码开源：[Code]

C-MTCSD：中文多轮对话立场检测数据集构建与基准评测 数据与评测负责人 | 2024.09 – 2025.01 | WWW 2025 共同一作

针对中文多轮对话语义理解中上下文依赖与隐式立场难点，构建大规模中文多轮对话立场检测数据集；从微博采集 5 个热点话题，完成 24,264 条实例标注（最深 6 轮），规模为同类中文数据集 4.2 倍
设计三阶段数据处理流水线与双人标注 + 专家复审机制，标注一致性达 0.972；实现 12 个模型全量评测（传统深度学习/预训练模型/对话专用模型/大语言模型），并按对话轮次/深度分析性能衰减规律（评测脚本与统计分析可复现）
结果：零样本场景下最优模型 GPT-4 平均 F1 为 64.07%，传统模型在隐式立场检测中 F1 低于 50%；发现对话深度每增加 1 轮性能平均下降 6.2%，最高衰减达 37.2%
数据开源：[Data]

NLP：语义理解与文本分类、立场检测、多轮对话建模、NLU、对话状态跟踪、对话策略

深度学习与 LLM 工具链：PyTorch、Prompt Engineering、LLM Agents（记忆/反思/可控生成）

工程与数据：Python、MySQL、Linux、Git；数据处理流水线与实验复现（配置管理/日志/统计分析）

学业奖学金

国家级竞赛

省级竞赛

📧 2931564251@qq.com 🔗 GitHub 🎓 Google Scholar