我在7月底结束了在TikTok为期2个月的实习。到如今9月份,已经过了2个多月,再不记录,就要把大部分记忆都忘掉了。
恰巧,9月1号我到了法国图卢兹,之后要在这里待一年。这几天刚刚安顿下来,正是对一切都充满期待和活力的时候,于是就在这个时候,抓紧写几篇博客吧。
开始
实习是我2025年的目标之一。我在2024年终总结里说过,临近毕业,需要选择去学术界还是工业界了。一个理性的选择,在我看来,主要由2个元素决定:根据自己掌握的信息,去最大化自己的目标。而我连公司都没有进去过,谈何选择?于是我在3、4月份的时候申请了几个公司的实习。
我和TikTok的实习其实蛮有缘分的。有一天,一个上海的电话打给了我新加坡的手机号,这种电话我一般是不接的,因为大概率是诈骗电话,而且如果真是重要的电话,还会打第二次,所以我直接挂了。结果对方真的打了第二次,我接上之后,说是新加坡TikTok的HR(给新加坡招聘的HR竟然在上海,这很奇怪),说他们组现在很缺人,问我要不要去面试一下,试试看,一般来说只要面试2次就好了。这个组做的内容和我的研究一点关系都没有:他们本质上是在解决时序预测问题,而我的科研则是网络传输和三维重建。所以我也觉得很奇怪为什么会找上我,但心想试试也无妨,权当是熟悉一下面试流程,练习面试技巧了,于是就答应了。
接下来的面试,我心态非常放松,一面我和面试官(后来是我的mentor)聊了聊我的科研,最后做一道编程题,都很顺利。我仍有印象的是,他问我,我的科研和他们组的内容没有什么关系,为什么要投他们。我回答说:
- 首先,我自己其实也觉得很奇怪,明明不匹配,为什么你们的HR来主动找我的。
- 第二,我觉得我们读博士,得到最大的训练,不是在某个研究领域上很会发文章,而是如何发现问题、解决问题。这种发现问题解决问题的能力是很泛化的。而且本质上来说,计算机学科各个方向之间都是互通的。以我为例子,我本科做的是医学图像的研究,硕士做的是根据手表传感器数据来识别人体行为的研究,博士又转向网络传输和三维重建,每个方向都是基本上不一样的,但我都做得不错,都发表了论文。
- 另外,我本科就学了机器学习,博士期间还当了三年《机器学习》这门课的TA,所以基础上是牢固的,只是没有接触最新的学术进展罢了。
二面的面试官(后来是我的+1领导)基本上走了同样的流程,但是因为我的某篇论文里涉及到对网络资源的分配优化的算法,他觉得我适合到他们大组里的另一个做统筹的小组,所以让我加一场面试。当HR通知我的时候,我就有点抵触了。因为我的研究和统筹其实没有任何关系,甚至比机器学习还离得远得多,我更加不会去这个小组。再去面试就是浪费时间了,因为双方都不会满意。我把我的想法告诉了HR,HR和组里的人交流了一下,就直接给我下Offer了。
当时还有新加坡华为给我下了Offer。他们的面试更加简单,第一面的时候,我和他们聊了聊我的科研,其中我有一篇论文做的是深度模型的压缩,和他们现在需要人来做的东西很匹配,所以上午面试,下午就给我下了Offer。其实面试后半段他们让我写代码题,我的表现很差:我先是没写出来,后来他们给我换了一道题,我也只会写一个暴力解法。我以为大概率失败了,但是没想到这么快就下了Offer。
很巧合的是,这2个Offer是在同一个星期下的。正如我在上一篇博客里写到的:“我最后选了TikTok,因为我觉得这是一家很大并且还在快速增长的公司,我挺好奇他们内部的情况,另外他们工资给得确实蛮多的……”还有一个次要原因,是TikTok、华为给我下了Offer后,他们的HR主管都给我发微信、邮件,和我约最后的HR面试,聊聊实习时间、薪资待遇等。TikTok的主管后来直接给我打了电话联系我,而华为的HR呢,我发了邮件约时间,她到了下周都没有理我……
过程和观察
在TikTok的2个月时间,其实很短。之所以只能2个月,是因为我9月份就要去法国了,而我想在去法国之前,把我的25年实习目标完成。这2个月时间,第1个月是在做业务的内容,要去搭建、部署模型去解决实际的问题。第2个月主要在和组里的人合作写论文。
第1个月的时间里,由我的mentor带我和另一个实习生,一起做TikTok Shop的仓库揽件预测。TikTok Shop采取了全托管的方式,简单来说,就是商家只需要提供商品,其他销售、定价、运输物流等环节,都直接交给TikTok这边负责。全托管的模式是又拼多多Temu率先提出的,后来大部分的跨境电商都跟进了。我要做的就是基于历史的货仓揽件数据,来预测未来1-4天的揽件数量,揽件数量预测从货仓维度细化到商家维度。
第2个月,我主要在和组里的人合作写论文。组里的领导看到了大语言模型的风头,一直在积极尝试把大语言模型引入时序预测的业务中,因此组里的有一部分人在探索使用大模型,并且发表了一些有趣的学术论文。
在这里记录几个我个人觉得蛮有趣的事情。
首先,随着欧盟国家的数据隐私法规越来越严格,原本在中国国内提供技术支持的算法团队,越来越难去访问欧盟国家的数据。因此,不得不在海外设立新团队,去专门处理敏感数据。新加坡被欧盟数据隐私法规豁免,也就是说在新加坡的公司可以合法地使用欧盟国家的数据,因此在新加坡的字节跳动或者TikTok这几年一直在迅速扩张,为了应对公司业务全球化的趋势。
第二,大语言模型近年风头正盛,字节跳动拥有非常丰富的GPU计算资源,电商基本上每个团队都在尝试将大模型应用在自己的业务场景里。一方面确实有相应的需求,另一方面也是在努力发掘自己团队的价值。我的观点不成熟,我觉得这就和我们研究人员写基金申请书一样,在总资源有限的情况下,需要向老板证明说明自己想要做的事情是有价值或者潜力的,才能给自己争取到资源。至于这件事情是不是真的在长远来看有价值,那就没有这么重要了。
第三,字节跳动,在我看来,是中国唯一一家真正做全世界生意的中国全球企业。阿里巴巴、腾讯主要还是在依托中国巨量的人口,赚中国人的钱。而字节跳动主要因为拥有TikTok,是真正意义上和Meta、Google一样,赚全世界钱的公司。字节跳动作为唯一一家全球性的中国企业,公司主要人员在中国,因此即使是在欧洲、北美、东南亚的分公司,也天然地倾向于招募会说普通话的员工。这对我们海外的中国学生其实是很好的,因为我们终于不再是被歧视的一方,而是拥有了“特权”的一方。
第四,新加坡的字节跳动,整体的氛围是轻松的,大家不需要打卡上班,没有对上班时长、投入度等的要求,只需要把工作做好就可以了。当然了,我的视角是绝对不完整的,因为我只是一个实习生,实习生是不会被刁难的,而且团队的氛围直接与领导相关,而我的mentor人非常好。这个宽松其实是建立在公司高密度的人才的基础上的。现在字节跳动只会找头部大学的毕业生,且对专业技能的要求也很高。这一方面是因为字节跳动作为一个大公司,本身就很有竞争力;另一方面也是因为近年找工作越来越难而大家又都冲向互联网,导致越来越内卷。
把话题扯开去,这种供远远大于求的情况,导致了公司们不再把人当做人,而是当做耗材:这个项目需要人,就招会做这个项目的人来;做完了,就可以直接踢掉了。大家都说字节跳动是一家:不配养人,只筛选人的人公司。
然而,我其实一直相信,人都是一样的,差距只是出现在后天,主要有两个关键点:首先,要有最基本的元学习的能力,也就是说自律、专注、责任心、有学习知识的一套方法论,等等,这个能力同样不是由人与生俱来的,很大程度上和个人无关,本质上是由国家的基础教育决定的;其次,社会也好公司也好,这些组织要有一套基本的培养制度,能够容许和带领人慢慢地学习和成长。这些在中国都是缺乏的。
举个例子,我在法国图卢兹国立理工研究院,有一个朋友博士毕业了,研究内容做的是PPT的分析和生成,发表了若干篇论文,而他现在在面试Mistral。Mistral是一家法国的大模型公司,是唯一一家做出了像样大模型的欧洲公司,也算是头部的大模型公司了,竞争力和DeepSeek相当。我不敢想象在中国,要面试头部的大模型公司,需要多辉煌的简历,但无论如何,至少做的研究得是大模型吧?但是法国好像不是这样的。当然我不会去美化欧洲国家,这种情况最大的原因是因为法国人少,他们各行各业都缺人,没得选,当然只能去从头培养新人。
就和玩战略游戏一样,当你作为决策者时,面对大量的人力和物力,你眼里的就只剩下了数据,而不是有血有肉的人了。
- 本文作者: YA
- 本文链接: https://shiyuang-scu.github.io/2025/09/06/【叶隙集】44-实习小记/
- 版权声明: 本博客所有文章除特别声明外,均采用 MIT 许可协议。转载请注明出处!