YA

In me the tiger sniffes the rose.

  • 主页
  • 世界之内
  • 世界之外
  • 叶隙随笔
所有文章 友链 关于我

YA

In me the tiger sniffes the rose.

  • 主页
  • 世界之内
  • 世界之外
  • 叶隙随笔

大语言模型正在伤害人机交互领域的研究

阅读数:21859次 2025-01-05
字数统计: 2.2k字   |   阅读时长≈ 7分

去年11月,一个做大语言模型(LLM)人机交互(HCI)的朋友给我发邮件问我最近怎么样,并给我发了一篇论文,是一篇综述,介绍了一个新的研究方向:用LLM,比如ChatGPT,来评估视频的质量。

也许是我的偏见,但是我所看到的现在大部分LLM相关的论文,除了对LLM本身的研究外,就是类似于“把LLM应用在XXX问题上面”的“研究”,而其中大部分都仅仅是单纯地用LLM来尝试解决X问题,然后对LLM的表现做一些评估和讨论。当然不能否定其价值了,但是以我小人之心度君子之腹,我很难相信所有开展这些工作的人都在真诚地研究问题,他们的目的只是为了发表一篇论文。我很早就看到用LLM来评估视频的质量的论文,但是一直都不好奇他们是如何做这个研究的,我想大概就是给ChatGPT发视频,让ChatGPT打分,然后对ChatGPT的打分能力做一定评估,最后得出诸如“ChatGPT可以用来评估视频质量”、“只要对ChatGPT说XXX提示词,它就能更准确地打分”之类的结论。我和朋友说:“How could you believe the ratings from a black box who itself cannot be believed”?

他给我分享了一篇文章,是一位同样做人机交互的教授(Ian Arawjo)写的,大致内容就是吐槽目前人机交互研究中滥用LLM的乱象。

我觉得写得很好,所以贴出中文翻译在这里,给记性很差的我留一个存档。


大语言模型正在伤害人机交互领域的研究

作者:Ian Arawjo;原文链接:LLM Wrapper Papers are Hurting HCI Research。

自 LLM 时代以降,我们作为人机交互领域的审稿人,看到了一个令人不安的现象:从贬义上讲,有非常多“LLM 包装袋(LLM Wrappers)”论文,即以 LLM 为包装,去解决 X 问题的论文,其实质内容和真正要解决的问题没有关系,只是挂羊头卖狗肉。这些“LLM 包装袋”论文经常引用少量的 HCI 文献,或者只在浅层次上涉及它,这些论文也只对 X 问题进行浅显的接触,并且研究的成果往往只是编辑 LLM 的提示词。他们说服审稿人接收自己论文的理由始终千篇一律————“虽然有相关工作,但还没有人将 LLM 应用于 X 问题。”

举一个例子。最近,一名学生转发给我一个帖子,内容是公开招募学生到实验室里做自然语言处理相关的研究项目。其中列出的研究项目,有几十个可以归结为:“将 LLM 应用于 X 问题。”当然,也许其中一两个项目还行,但所有这几十个项目呢?一位教授的十几个项目都是关于将 LLM 应用于从心理健康到写作领域的不同问题?我很难相信撰写这些论文的人,会深入而真诚地参与到每一个问题或目标用户中:他们的目标仅仅是炮制一篇论文。

这些涌向人机交互学术会议的论文,给本已不堪重负的审稿过程带来了更大的压力。审稿人花了很多时间阅读用 LLM 包装的论文,但是他们的审稿意见往往可以归结为同一点:“很少谈及人机交互的相关文献,系统和用户研究肤浅,系统设计的决策值得怀疑。”我今年担任 UIST 会议的主席,并审稿了许多这样的论文,到最后我的经验是:我大约一半的审稿意见都与这些“LLM 包装袋”论文有关(这个问题变得如此严重,以至于我甚至创建了一个审稿意见的模板来对待这些文章)。我的这些时间和精力,本可以花在其他事情上。

我怀疑这些提交的论文,很大一部分来自于具有机器学习或自然语言处理背景的作者。他们提交到自己领域的会议里(比如NeurIPS 或 EMNLP)的论文被拒了,所以又重新投稿到我们人机交互领域的学术会议里来。这些机器学习或自然语言处理的会议,因为过多论文投稿,而一直饱受严重的审稿负担问题;现在,我们看到同样的问题也因此进入了人机交互会议。其中一些作者可能是具有这些背景的学生,赌博似地提交论文,希望自己的论文能够像中彩票般被接受。

然而,问题并没有随着紧张的审稿而结束。如果这些以 LLM 为包装的论文得到发表或作为预印本,他们就占用了大量不必要的空间:如果新的研究者对 X 问题有足够的专业知识,并且基于过去的研究和用户的实际需求,小心地将 LLM 应用于该问题,并提出实际、有效的设计决策————那么这些新的研究者可能会被审稿人要求将他们的研究与那些以 LLM 为包装的论文做比较,因为这些“LLM 包装袋”论文已经先到先得了,即使它们只是“背景噪声”。我已经可以预见一位没有经验的审稿人会问他们:“Y 篇论文已经将 LLM 应用于这个问题,那么你的工作有什么创新性呢?”这些以 LLM 为包装的论文,已经占据了领地,并用垃圾填充它,新来的研究者需要淌过这摊浑水,才能证明他们的研究是有效的、有创新性的。

说实话,我认为提交这些论文的作者应该承担大部分责任,但不是全部。部分责任还在于奖励这种行为的激励机制,这种激励机制使得这种行为得以蓬勃发展。我们也是五十步笑百步。

是什么让你摆脱了 LLM 包装监狱?

即使你同意我的观点,认为目前的情况确实存在问题,那么你可能也想知道,我们应该如何与这些垃圾论文划清界限。什么算作以 LLM 包装的论文,什么不算?又比如说,我们对“LLM 应用于 X 问题”这个研究主题,进行了一次很好的研究、评估,如果最后的成果仅仅是改变ChatGPT的系统提示词,但是否可以说我们的贡献是无关紧要的呢?

主观上说,我认为有几个决定性因素综合起来,将论文推到了以 LLM 包装的论文之外。对于人机交互的研究而言,这些是:

  • 对相关文献的真实讨论(包括领域内和领域外,比如,有关心理健康的论文,需要涉及心理健康文献和之前人机交互在心理健康方面的工作);
  • 关于为什么要应用 LLM(而不是“非 AI”方法)的充分理由;
  • 在系统设计、架构迭代上所花费的努力;
  • 除了隐含的“我们将 LLM 应用于这个问题,以前没有人这样做过”之外,对研究的贡献和创新性进行论证;
  • 深入仔细的用户研究,而不仅仅是基本的可用性测试,比如叫几个用户来给系统打分,或者简单的消融研究。

以上只是可以让你摆脱“LLM 包装袋”论文的牢笼的一些要素。我们需要围绕这类论文建立相关标准,并且作为指南和警告传达给投稿的作者。例如,对于即将举行的 CHI 或 UIST 会议,我们可能会考虑以下警告:

  • “如果您不讨论过去人机交互会议和期刊中的相关文献,您将被直接拒稿。”
  • “如果您的主要贡献是改变 LLM 的系统提示词,然后对其进行研究,您可能会被直接拒稿。”

这些并不是完美的指导方针,但我们需要先说出问题所在,以便一起努力解决。否则,我们将继续被大量的以 LLM 为包装的论文所淹没,这些论文来自那些懒得去研究过去的人机交互文献、不诚实地研究问题、唯一目标就是发表论文、然后重复这个过程的作者。

这也太糟糕了。

赏

谢谢你请我吃糖果

支付宝
微信
  • 本文作者: YA
  • 本文链接: http://www.yuuuuang.com/2025/01/05/大语言模型正在伤害人机交互领域的研究/
  • 版权声明: 本博客所有文章除特别声明外,均采用 MIT 许可协议。转载请注明出处!
  • 随笔
  • 世界之内

扫一扫,分享到微信

【叶隙集】41 盘旋的白文鸟
【叶隙集】40 台湾旅行
  1. 1. 大语言模型正在伤害人机交互领域的研究
    1. 1.1. 是什么让你摆脱了 LLM 包装监狱?
© 2018-2025 YA
GitHub:hexo-theme-yilia-plus by Litten
本站总访问量25438次 | 本站访客数20596人
  • 所有文章
  • 友链
  • 关于我

tag:

  • 随笔
  • 年终总结
  • 世界之内
  • 世界之外
  • 叶隙集
  • 机器学习
  • 叶隙随笔
  • 图像处理
  • 数据挖掘

    缺失模块。
    1、请确保node版本大于6.2
    2、在博客根目录(注意不是yilia-plus根目录)执行以下命令:
    npm i hexo-generator-json-content --save

    3、在根目录_config.yml里添加配置:

      jsonContent:
        meta: false
        pages: false
        posts:
          title: true
          date: true
          path: true
          text: false
          raw: false
          content: false
          slug: false
          updated: false
          comments: false
          link: false
          permalink: false
          excerpt: false
          categories: false
          tags: true
    

  • 2024年终总结

    2025-04-08

    #随笔#年终总结

  • 【叶隙集】41 盘旋的白文鸟

    2025-01-12

    #随笔#叶隙集

  • 大语言模型正在伤害人机交互领域的研究

    2025-01-05

    #随笔#世界之内

  • 【叶隙集】40 台湾旅行

    2024-12-22

    #随笔#叶隙集

  • 【叶隙集】39 搬家了

    2024-09-05

    #随笔#叶隙集

  • 2023年终总结

    2024-06-27

    #随笔#年终总结

  • 【叶隙集】38 参加学术会议

    2024-05-22

    #随笔#叶隙集

  • Notes of 3D Gaussian Splatting

    2024-03-19

    #世界之内

  • 【叶隙集】37 音乐会和朋友

    2023-12-04

    #随笔#叶隙集

  • 【叶隙集】36 QE和音乐会

    2023-11-02

    #随笔#叶隙集

  • 【叶隙集】35 新室友和更积极的生活

    2023-09-11

    #随笔#叶隙随笔

  • 读书笔记|《规训与惩罚》

    2023-08-27

    #随笔#世界之外

  • 【叶隙集】34 无法参加学术会议

    2023-06-28

    #随笔#叶隙集

  • 【叶隙集】33 回国后与朋友和家人们的聚会

    2023-06-11

    #随笔#叶隙集

  • 视频压缩技术概述

    2023-04-28

    #世界之内

  • 2022年终总结

    2023-03-31

    #随笔#年终总结

  • 【叶隙集】32 平和的心态

    2022-12-27

    #随笔#叶隙集

  • 【叶隙集】31 双相情绪障碍症

    2022-12-17

    #随笔#叶隙集

  • 【学习笔记】CS5229 Advanced Computer Network

    2022-12-17

    #世界之内

  • 【叶隙集】30 下半学期太忙了!

    2022-11-25

    #随笔#叶隙集

  • 【叶隙集】29 当助教的半个学期

    2022-10-07

    #随笔#叶隙集

  • 【叶隙集】28 忙碌的第一个月

    2022-08-31

    #随笔#叶隙集

  • 【叶隙集】27 老师的职责

    2022-07-31

    #随笔#叶隙集

  • 【叶隙集】26 新加坡太难找工作了

    2022-07-23

    #随笔#叶隙集

  • 【叶隙集】25 生产工具、学习生活和阅读笔记

    2022-07-15

    #随笔#叶隙集

  • 【叶隙集】24 学习、科研、旅行和爱与关怀

    2022-06-24

    #随笔

  • 【叶隙集】23 学习与研究

    2022-04-26

    #随笔#叶隙集

  • 【学习笔记】人工智能规划与决策

    2022-04-26

    #世界之内

  • 博士申请的总结

    2022-03-31

    #随笔

  • 【叶隙集】22 新的体验和宗教

    2022-03-07

    #随笔#叶隙集

  • 2021年终总结

    2022-01-08

    #随笔#年终总结

  • 【叶隙集】21 新朋友和学术报告

    2021-10-31

    #随笔#叶隙集

  • 【叶隙集】20 音乐会与教训

    2021-10-19

    #随笔#叶隙集

  • 【叶隙集】19 六周年纪念日

    2021-10-03

    #随笔#叶隙集

  • 【叶隙集】18 疫情与疫苗

    2021-09-24

    #随笔#叶隙集

  • 摘录|联合国2021年气候问题总结报告的摘要

    2021-09-19

    #世界之外

  • 【叶隙集】17 音乐会和读书

    2021-09-08

    #随笔#叶隙集

  • 【叶隙集】16 喜欢上了游泳

    2021-09-01

    #随笔#叶隙集

  • 【叶隙集】15 课前的夜曲

    2021-08-24

    #随笔#叶隙集

  • 【叶隙集】14 平稳的学习生活

    2021-08-16

    #随笔#叶隙集

  • 【叶隙集】13 生活与朋友

    2021-07-15

    #随笔#叶隙集

  • 【叶隙集】12 毕业

    2021-06-30

    #随笔#叶隙集

  • 【叶隙集】11 毕业前的生活

    2021-06-23

    #随笔#叶隙集

  • 读书笔记|《国境以南,太阳以西》读后感

    2021-06-17

    #随笔

  • 【叶隙集】10 青甘环线旅行

    2021-06-13

    #随笔#叶隙集

  • 半监督学习|论文粗读

    2021-06-07

    #机器学习

  • 【叶隙集】9 纯粹地生活

    2021-06-06

    #随笔#叶隙集

  • 【叶隙集】8 生活的界限

    2021-05-30

    #随笔#叶隙集

  • 【叶隙集】7 隔离结束

    2021-05-21

    #随笔#叶隙集

  • 【叶隙集】6 隔离生活

    2021-05-14

    #随笔#叶隙集

  • 【叶隙集】5 新的阶段

    2021-05-08

    #随笔#叶隙集

  • 【叶隙集】4 团队管理

    2021-04-30

    #随笔#叶隙集

  • 【叶隙集】3 过低的自我评价

    2021-04-23

    #随笔#叶隙集

  • 【叶隙集】2 方向与交往

    2021-04-16

    #随笔#叶隙集

  • 【叶隙集】1 原爆点-续

    2021-04-08

    #随笔#叶隙集

  • 随笔|目的与纯粹

    2021-03-28

    #随笔

  • 随笔|白文鸟

    2021-01-20

    #随笔

  • 写在一百以后——2020年终总结

    2021-01-01

    #随笔#年终总结

  • 随笔|选择

    2020-12-25

    #随笔

  • 读书笔记|《人生的意义》总结、摘录

    2020-11-25

    #世界之外

  • 书评|Normal People, Normal Love

    2020-10-07

    #随笔

  • Decision Making|人工智能、机器学习与强化学习的概述与比较

    2020-10-03

    #世界之内

  • 随笔|疫情后的总结

    2020-09-10

    #随笔

  • 学习笔记@PRML|1 Introduction

    2020-07-31

    #世界之内

  • 随笔|面试后的回顾与思考

    2020-07-26

    #随笔

  • 数据挖掘|数据挖掘概论笔记

    2020-06-24

    #世界之内#数据挖掘

  • 续写|美女或野兽

    2020-06-18

    #随笔

  • 随笔|无常

    2020-05-31

    #随笔

  • 现象学|胡塞尔《小观念》笔记

    2020-05-13

    #世界之外

  • 随笔|我的局限性

    2020-05-13

    #随笔

  • 随笔|胡乱的记录

    2020-04-09

    #随笔

  • 随笔|疫情

    2020-02-16

    #随笔

  • 随笔|怅惘地忖度

    2020-01-29

    #随笔

  • 2019年终总结

    2019-12-08

    #随笔#年终总结

  • 机器学习|Flow-based Model学习笔记

    2019-11-06

    #世界之内#机器学习

  • 【Introduction to TensorFlow】03 卷积神经网络与复杂数据集

    2019-10-31

    #世界之内#机器学习

  • 【Introduction to TensorFlow】02 初识机器学习与计算机视觉

    2019-10-29

    #世界之内#机器学习

  • 【Introduction to TensorFlow】01 TF 快速入门

    2019-10-29

    #世界之内#机器学习

  • 【Introduction to TensorFlow】00 课程概览

    2019-10-29

    #世界之内#机器学习

  • 随笔|呓语

    2019-10-27

    #随笔

  • 周记|面纱 久别重逢

    2019-09-21

    #随笔

  • 学习笔记|拟合优化

    2019-09-15

    #世界之内

  • 周记|爱人 体验 芝诺

    2019-09-07

    #随笔

  • 摘录|造成不幸福的原因之六:嫉妒

    2019-09-06

    #世界之外

  • 随笔|虚无 纵欲

    2019-08-22

    #随笔

  • 周记|尘埃落定

    2019-06-29

    #随笔

  • 周记|本能 愉悦 基因

    2019-06-12

    #随笔

  • 周记|空荡荡

    2019-06-02

    #随笔

  • 四月裂帛——读《女儿红》

    2019-05-30

    #随笔#世界之外

  • 机器学习|主成分分析

    2019-05-10

    #世界之内#机器学习

  • 《好运设计》史铁生

    2019-05-09

    #世界之外

  • 机器学习|感知机与支持向量机

    2019-04-27

    #世界之内#机器学习

  • 周记|记忆 概念 庸俗

    2019-04-27

    #随笔

  • 机器学习|模型评估与选择

    2019-04-17

    #世界之内#机器学习

  • 机器推理|SLD Resolution

    2019-04-06

    #世界之内

  • 第五代计算机

    2019-03-31

    #世界之内

  • 学习笔记|Volume Rendering

    2019-03-31

    #世界之内#图像处理

  • 周记|三月驼云

    2019-03-28

    #随笔

  • 生成对抗网络与强化学习:文本生成的方法

    2019-03-11

    #世界之内

  • 《桨声灯影里的秦淮河》俞平伯

    2019-03-09

    #世界之外

  • 周记|雨

    2019-03-09

    #随笔

  • 《春之积雪》简媜

    2019-03-01

    #世界之外

  • 周记|逃离

    2019-02-15

    #随笔

  • 存在主义是一种人道主义

    2019-02-11

    #世界之外

  • 学习笔记|比较文学

    2019-02-09

    #世界之外

  • 尼采的美学

    2019-02-01

    #世界之外

  • 哲学涉猎

    2019-02-01

    #世界之外

  • 读书笔记|光的诗人——《如何看懂印象派》

    2019-01-28

    #随笔#世界之外

  • 叔本华的生命意志哲学

    2019-01-25

    #世界之外

  • 再也不要把他们弄丢了

    2019-01-21

    #随笔

  • 2018年终总结

    2018-12-31

    #随笔#年终总结

  • 人类的心理行为模式

    2018-12-25

    #世界之外

  • 周记|神经症人格

    2018-12-22

    #随笔

  • 【周记】旋转

    2018-11-30

    #随笔

  • 七牛云Bucket失效

    2018-11-21

    #世界之内

  • 周记|从前的日色慢

    2018-11-21

    #随笔

  • 【数理逻辑】Incompleteness Theorem

    2018-11-10

    #世界之外

  • 专业随想

    2018-11-05

    #随笔

  • 生活

    2018-11-04

    #世界之外

  • 计算机组成与体系结构

    2018-11-04

    #世界之内

  • 【强化学习】Policy Gradient

    2018-11-03

    #世界之内

  • 怀疑是否有价值——怀疑论

    2018-10-30

    #世界之外

  • 周记|Every hero and coward

    2018-10-20

    #随笔

  • Web in Java

    2018-10-11

    #世界之内

  • 周记|十月女泽

    2018-10-02

    #随笔

  • 托福备考

    2018-09-28

    #世界之内

  • 周记|裸体之舞

    2018-09-24

    #随笔

  • 周记|中秋幸福

    2018-09-18

    #随笔

  • History of artificial intelligence

    2018-09-09

    #世界之外

  • 周记|我那无趣的灵魂

    2018-09-09

    #随笔

  • Softmax Regression

    2018-09-08

    #世界之内

  • 周记|Rational

    2018-09-02

    #随笔

  • 贰 《SICP》笔记:模块化、对象和状态

    2018-08-05

    #世界之内

  • 周记|困倦

    2018-08-04

    #随笔

  • 壹 《SICP》笔记:构造数据抽象

    2018-07-31

    #世界之内

  • 周记|原爆点

    2018-07-31

    #随笔

  • 零 《SICP》笔记:构造过程抽象

    2018-07-23

    #世界之内

  • Norms or maybe more

    2018-07-09

    #世界之内

  • 事已至此

    2018-06-24

    #随笔

  • 【增强学习】AirSim搭建

    2018-06-02

    #世界之内

  • 【机器学习】BP算法

    2018-05-26

    #世界之内

  • 【康德】宏大的哲学语境

    2018-05-26

    #世界之外

  • 【康德】康德的研究领域是什么

    2018-05-11

    #世界之外

  • 【高等数学】什么是梯度(期中考试复习思考)

    2018-04-29

    #世界之内

  • 《自控力》读书笔记

    2018-04-21

    #随笔

  • 【线性代数】The Essence of Linear Algebra

    2018-04-21

    #世界之内

  • 【数据结构与算法】临时抱佛脚

    2018-03-10

    #世界之内

  • 科技革命与人类社会——《论工业社会及其未来》读后感

    2018-03-08

    #随笔

  • 《论工业社会及其未来》原文摘录

    2018-02-23

    #世界之外

  • 《如何高效学习》读后总结

    2018-02-19

    #随笔

  • 《精进》chapter-2读后总结

    2018-02-13

    #随笔

  • A Review of Brian - Inspired Computer Vision

    2018-02-11

    #世界之内

  • 最近有个女生,说对我很失望

    2017-12-07

    #随笔

  • 病入膏肓

    2017-01-29

    #随笔

  • 白文鸟

    2016-10-29

    #随笔

  • 《不能承受的生命之轻》读后感

    2016-07-13

    #随笔

  • 都五月份了

    2016-04-29

    #随笔

  • 《四月裂帛》简媜

    2014-09-29

    #世界之外

  • Wuuuudle
  • Nemo
  • Elmo (yyh)
  • highestpeak
  • Kazoo Blog
努力做一名谦逊、独立、乐于思考的学生