• xxx - 2023.12,起点:NLP、计设比赛
  • 2024.03 - 2024.04,入门:大数据比赛、机器学习
  • 2024.06 - 2024.07:Kaggle、LLM基础知识学习
  • 2024.08 - 2024.10|第一篇研究:LLM safety、代码题评测、prompt优化
  • 2024.11 - 2025.01 论文撰写,深入学习
  • 2025.01 - 2025.03|多模态:LLM音视频理解
  • 2025.04 - 2025.05:投稿、转投、中稿
  • 2025.06 - 2025.09:保研
  • 2025.08 - 2025.10:Kaggle
  • 2025.10 - 2026.01|第一篇顶会:RLVR、机制解释、ICML
  • 2026.01 - xxx|sustech、agent、毕业

回头看这几年,我所谓的科研起点并不怎么高,也谈不上有什么清晰规划。2022年高考完,成绩也并不好,选择这个新疆所谓的211大部分也就是聊以自慰吧。分数不高,最开始进的建筑专业,很幸运转到了计算机专业,但大一的学生有什么专业理解呢,当时在网上看到计算机本科专业收入高,信息安全专业在计算机本科中更高(现在看来感觉是野鸡消息),最终莫名其妙的选择转到了这个专业。

刚入学,看到学院,学校的各种消息,什么某某学长学姐保研去清华或者各种985高校,我会在想是否我也能保研,保去各种名校。同时学院的各个老师也在宣传,这些学长学姐本科积极参加各种竞赛(现在来看屁股决定脑袋/立场),学院层面会倾向让学生去参加各种水赛,但现在来看其实这些水赛并不会真的对学生个体产生什么根本性作用。但当时的我可能会更加希望抓住一些可能的机会,所以大一大二我也跟着大部队参加一些莫名其妙的水赛,拿到了一些奖项,或者说安慰奖。

ict

xxx - 2023.12,起点:NLP、计设比赛

后面开始自己询问学长学姐保研的经验,他们会有更加“功利”的经验,比如参考学校的竞赛名单,去针对性的“刷”各种水赛的奖项,去凑加分。于是我深以为然,到了大二上学年(24年上半年)的计设比赛,我开始主动去学习相关技术,找队友设计项目,

最后是拿了很多个省三的奖项,但是我看到那些省一的项目,或者说进国赛的项目,我开始思考我们之间会有很明显的差距吗,或者说有什么根本性的区别吗?

大家都是本科生水平,有很水的项目进了国赛,也有当时我看着很牛逼的项目也没拿到很高的奖项。之后我觉得可能这些水赛对我们或者说本科生个人并没有什么培养/提升的作用,更多是学院老师本身的要求。

2024.03 - 2024.04,入门:大数据比赛、机器学习

后面我开始学习机器学习,当时ai或者说深度学习开始火热(起码在当时我的眼界里是这样)。我又听说了数学建模这个比赛,我开始学习各种机器学习,大数据算法,跟队友探讨选题,技术,论文。我开始第一次在服务器上学习Linux语法,怎么处理数据,训练模型,评估指标,最后自己第一次写出了一个像模像样的论文。当然最后也只是拿了一个三等奖

tjjm

2024.06 - 2024.07:Kaggle、LLM基础知识

后面我开始接触kaggle,我觉得这个比赛更加真实,或者说客观,更加贴合真实项目:所有人都是看分给每次。

我从每个月的新手赛(playground)入手,自己学习手搓各种深度学习模型,开始了解各种数据的特征处理,这时候仅仅是兴趣,我会因为某一次提交的高分感到兴奋,我觉得这时候的比赛会有一种纯粹的乐趣。

后面自己摸索了几个月,我开始参加真正的kaggle奖金赛,我选择了比较有名的Jane Street金融时序预测,我学习往届参赛选手的方案,在最开始以外的取得了不错的每次,也在这时找到了之后一起竞赛两年多的队友。

js

2024.08 - 2024.10|第一篇研究:LLM safety、代码题评测、prompt优化

之后暑假到了,经过更深层次的了解,我意识到,升学,或者说保研,更重要的应该是科研训练,或者直白的说应该是论文。当时我的理解是比赛人人都有,但科研成果应该是更稀缺的。

此时我在网上找了各种广告招生贴,但投了几个也没下文。于是我问了Dr. Lyu是否能带我入门,很幸运科研入门有一个非常好的领路人。刚好当时我找校内老师留校希望参加项目,最后被鸽了没事做,正好利用了暑假两个月时间,很高效的学习了入门资料,如Stanford的cs224n。

我印象最深的是线上会议,最开始一个词向量的概率不甚了解,到最后学完对LLM有一个最基本的概率了解,我觉得基础打牢永远是最重要的(包括之后接触小几届的本科生,对基础没概念,交流十分费劲,方向也容易跑偏)。

暑假接近结尾,Dr. Lyu给了我几个主题,我记得当时我是写代码一个个评测的当时比较火的LLM JailBreak,最后是半途而废了,转向了最终的coding prompt优化。当时刚好gpt的o1模型问世,应该是第一个thinking模型?我一个个找代码题,写评测代码。当时技术不熟,写的代码有bug,甚至白跑了Dr. Lyu的额度:(。

最后第一版初稿大部分也不是我写的,我开始学习论文应该怎么写,主要是latex,当然后面llm发展变得更简单了。总之最后搓出了人生第一篇paper。

arxiv

2024.11 - 2025.01 论文撰写,深入学习

参与完第一篇论文,此时我对论文,或者说科研,抑或是实验有了很深的理解。此时我的主线一定程度回归了课程学习,我在跟上文的队友参与kaggle的同时,线下到深圳参观了阿里中心:)。此时新的任务变成了调研mllm,撰写补充一篇survey的同时,提升我对近期工作,尤其是多模态llm的理解。值得一提,当时我最喜欢用的ai当属claude3.5,可能这就是白月光吧,帮助我撰写了一篇paper,我应该会永远记得这个claude版本:)。

最后积累了两篇文章,一起投稿到了ijcnn会议,当时依然会有“功利”的想法。两篇起码会中一篇?毕竟是参考当时学校保研的政策,只需要中一篇加分就能满了,可惜最后一篇也没中。

2025.01 - 2025.03|多模态:LLM音视频理解

之后寒假回家,有了更加前沿?或者说更加具体的课题。当时最新的视觉模型应该是Qwen2.5-VL,当时音视频模型,或者说全模态模型尚有空缺?于是我开始调研。我印象最深的就是我真的一行行阅读了transformers库里Qwen2.5-VL的源码,大约几千行代码,当时没有coding agent,我一行行读下去,遇到不懂的,复制那段代码,一行行溯源,从代码层面理解MLLM,从视觉输入到output输出的全流程。我觉得这应该是大学四年我最深入的代码经历了。

同时很幸运的是我能用的显卡资源也远超其他人。包括我之后了解的,大部分学校或者实验室,能用的显卡资源很局限,很幸运起码我没怎么被显卡资源局限过:)。

最后有了上述的积累。我开始真正自己撰写论文,有了ai的辅助,我开始仿照其他人的写法,自己画图,组织架构撰写论文。可能也算那句话,优化ai的帮助,极大可能的磨平了语言的差异。

2025.04 - 2025.05:投稿、转投、中稿

返校后很可惜之前投稿的两篇论文都没中,有了之前的举例我对投稿包括论文模板流程有了极大的了解,我开始独自修改模板转投,同时针对上一个多模态的工作,写成最终版论文投稿nips。现在来看确实还是差一点顶会的水平。

4月底,最开始的prompt工作终于中了第一篇论文,当时的兴奋之情现在仍有印象。中的第一篇论文应该是最有意义的。之后我开始准备保研,有了第一篇中稿,包括当时在投的三篇,其中一篇nips在投在当时确实挺唬人,帮助我拿到了许多老师的面试。回顾前两三年,确实对于老师,或者研究生导师,比赛的作用确实不如实际的科研训练或者说成果。

2025.06 - 2025.09:保研

这段时期我大多在忙于保研,此时我养成了一个别样的习惯:我开始借助kaggle比赛消磨时间。换而言之,我喜欢通过kaggle转移我的注意力,也不失为一种转移压力的方式。

通过上述的科研成果,我拿到了不少的交流机会,并且第一次线下参加了论文的学术会议,并做了一个水到不行的oral报告。

ustc

icic

fudan

beili

这段时间的各种面试,让我更多的理解了一个老师会更喜欢哪种学生,或者说更关注哪一部分。同时人外有人,见过更多发布了各种论文的学生。如果就最终的保研流程让我总结,我会说这一路的科研成长是帮助最大的部分。

2025.09 - 2025.10:Kaggle

保研结束后我依然保持着kaggle的习惯,跟队友又拿了几个奖牌。

2025.10 - 2026.01|第一篇顶会:RLVR、机制解释、ICML

接下来有了新的课题,跟ruizhe老师进行了一个与之前大不相同的课题。从之前有所耳闻的Spurious Rewards出发,通过一步步措施定位干预,最终完成了这项工作。对我最大的启发可能是:不是所有工作都需要堆算力,堆资源才能算有意义。

2026.01 - xxx|sustech、agent、毕业

之后到南科大当访学,第一次到南科大,让我明白了为什么高水平的平台对个人有更高的助力,高质量的环境或者设施确实能很大程度的影响一个人。陈老师带我进行了第一次组会,陈老师的学术水平确实很高:)。这段时间我自己调研相关课题,各种方向进行了解,应该算是极高效率的学习各种文献。最后自己选择了一个方向并完成了一个课题。

同时我开展了video agent的项目,自己一个人一个多月的时间搭好脚手架,找到并组织其他人一起完善,这时候就回到最开始的科研/技术基础问题:一个人的基础是否完善,深刻影响其实际水平。换而言之,用ai也分用ai的水平高低:(,尽管现在的coding agent快速完善,但一个人会不会用真的很明显:(。

如果用一句话概括这几年,那就是前三四年我被一个“功利”的目标推着走。或者说有目标才会有动力。一步步从比赛,到科研,到论文。最开始拿一个奖就好了,到有一篇论文,或者有一篇顶会,心态在不断变化。

现在再看这段经历,我更愿意把它理解为一种本科阶段的科研预训练。它让我从一个只知道名词的本科生,逐渐变成一个能独立推进实验、理解论文流程、参与研究讨论、承担项目责任的人。

jblk