【叶隙集】41 盘旋的白文鸟

2025-01-13

字数统计: 1k字 | 阅读时长≈ 3分

今天睡前看了加缪的《异乡人》，因为打算将其赠与友人，所以想着得抓紧再看一遍。台灯昏黄，眼前看着书，耳边响着巴赫，没看几页便困倦了，于是便打开手机看看有无消息，却无意间瞥见了简媜的《贴身暗影》中的开头。

一只湿漉漉的白文鸟在发冷的城市迷飞

漩涡似的高高低低

忽然一头撞上褐色玻璃墙

雨，下得像流浪狗

more >>

展开全文 >>

大语言模型正在伤害人机交互领域的研究

2025-01-05

字数统计: 2.2k字 | 阅读时长≈ 7分

去年11月，一个做大语言模型（LLM）人机交互（HCI）的朋友给我发邮件问我最近怎么样，并给我发了一篇论文，是一篇综述，介绍了一个新的研究方向：用LLM，比如ChatGPT，来评估视频的质量。

也许是我的偏见，但是我所看到的现在大部分LLM相关的论文，除了对LLM本身的研究外，就是类似于“把LLM应用在XXX问题上面”的“研究”，而其中大部分都仅仅是单纯地用LLM来尝试解决X问题，然后对LLM的表现做一些评估和讨论。当然不能否定其价值了，但是以我小人之心度君子之腹，我很难相信所有开展这些工作的人都在真诚地研究问题，他们的目的只是为了发表一篇论文。我很早就看到用LLM来评估视频的质量的论文，但是一直都不好奇他们是如何做这个研究的，我想大概就是给ChatGPT发视频，让ChatGPT打分，然后对ChatGPT的打分能力做一定评估，最后得出诸如“ChatGPT可以用来评估视频质量”、“只要对ChatGPT说XXX提示词，它就能更准确地打分”之类的结论。我和朋友说：“How could you believe the ratings from a black box who itself cannot be believed”？

他给我分享了一篇文章，是一位同样做人机交互的教授（Ian Arawjo）写的，大致内容就是吐槽目前人机交互研究中滥用LLM的乱象。

我觉得写得很好，所以贴出中文翻译在这里，给记性很差的我留一个存档。

more >>

展开全文 >>

【叶隙集】40 台湾旅行

2024-12-22

字数统计: 3.1k字 | 阅读时长≈ 10分

11月3号到11月12号，我去了台湾旅游。

more >>

展开全文 >>

【叶隙集】39 搬家了

2024-09-05

字数统计: 2.6k字 | 阅读时长≈ 8分

我在六月初回到了新加坡。这三个月时间主要做了两件事：科研和搬家。

more >>

展开全文 >>

2023年终总结

2024-06-27

字数统计: 5.4k字 | 阅读时长≈ 18分

已经很久没有总结和思考过自己的生活——距离上一次写作是在去年了。不知不觉2023年溜了过去，又不知不觉到了2024年的4月，我写了一点，但是实在太懒，也比较忙，于是又憋到了6月，新一年的二分之一都已经过去。我心想着，这2023年年终总结再不写，我就要把2023年发生了什么都忘了。于是便找了一个时间，先逼自己写点东西出来再说吧。

2024年6月份底写了一篇《2023年终总结》，真是贻笑大方了……

more >>

展开全文 >>