祝各位 2024 年快乐!尽管这个博客几乎不会有人看……

祝各位 2024 年快乐!尽管这个博客几乎不会有人看……


因为有同学和朋友咨询我关于择业的问题,我就找了这个经典文章,叫《如何选择一个真正适合你的职业》,作者是 Tim Urban 在 2018 年写的,中文翻译:谢熊猫君。 我做了一个排版,加了点插画不致于阅读起来那么累。原文和翻译链接在底部,推荐给迷茫中的朋友们。 https://vip.liuyuntian.com/How_to_Pick_a_Career_That_Actually_Fits_You

我和坤宝。

用翻译看了这个论文,很有趣的时间向量,能提升模型的适应性和前瞻预判性。通过在不同的时间向量间进行插值,即使在未经训练的时间段内,也能有更好的表现。
这很像人在思考问题的过程,之前的事儿我想一想,中间的我想一想,进而对今天或未来更准确的判断。将这种思维方式融入到模型的微调中,更接近于模拟人脑的思考过程。非常佩服这些人,居然是本科生,能把这种事儿做得非常精致。
论文:https://arxiv.org/abs/2312.13401
Code:https://github.com/KaiNylund/lm-weights-encode-time

用 chatGPT 详细解释:
这张图似乎是关于时间序列或者时间点向量的结构及其推广的概念性表示。图中分为三个部分,我们一一来解释:
这张图可能是来自于某个关于时间序列分析、预测模型或机器学习中处理时间数据的教程或论文。图中的θ可能代表状态变化的时间点,而τ代表时间间隔。整体来看,这张图试图展示如何从已知的时间点推广到未知的时间点,无论是位于已知点之间还是在已知点之后。
© 2026 Xiaoxiao’s Weblog. 粤ICP备15088982号