惠每云科技二面

公司介绍

面试形式:电话面试

面试问题

面试偏八股,主要就是问问简历项目。面了半个小时。

1. 简历问题

1. Q: 自我介绍(点我展开) A: Q:问了一些个人情况,比如是否满足毕业要求之类的? A:满足毕业要求,我的导师也不怎么管我
2. Q: 你做的项目里有没有做的比较好的?介绍一下? A: 对简历里的一个项目(某海域背景场全水深预报)进行介绍
3. Q: 你的模型的架构是什么?亮点是什么? A: 架构略。亮点是能有效降低累计误差,并且是一个全水深预报
4. Q: 你的模型Encoder用的CNN我能理解,为什么Decoder也需要用CNN呢? A: 因为我模型的输出也是图像,并且我想让他和输入层的图像维度一样,我需要把Encoder压缩掉的空间特征上采样回去,类似U-Net
5. Q: 你的模型效果怎么样? A: (支支吾吾)跟那些大模型在前几天上差不多,(讲了一堆局部海域为什么需要小模型,小模型相对于大模型的优势)
6. Q: 你的模型输入数据的维度? A: 是五维的数据 维度是 (B,T,C,H,W) 分别代表批量大小、时间数、通道数、高度、宽度 Q:你这个模型的时间维度是把不同时刻的图像堆叠到一块处理的吗? A:是的,把 T-72 到 T 的数据堆叠到一块作为X,预测 T+3 A:C是各个变量,H是纬度,W是经度
7. Q: 那你是怎么实现T+3以后的预报的? A: 我就是把模型的输出再作为下一次的输入,循环迭代实现多步预报,相当于自回归
8. Q: 你模型的loss是什么? A: MSE
9. Q: 你的模型和其他模型相比效果怎么样? A: 跟22年之前的模型比是更优的,但还是比不过大模型
10. Q: 你的模型的loss和其他模型的loss比怎么样? A: 因为我们这种温盐海流数据,一般需要做个归一化再输入模型里面
11. Q: 你这个预报结果能的做的好的原因是什么? A: 我觉得可能是CNN本身具有关注局部特征的一个特征,海洋的温度盐度啥的一般都是有连续性的,CNN的这种特征更适合小区域连续变化的数据 A:还有就是对时间特征的这种处理上,我这里是把T-72到T的数据放在一块了,不会向RNN一样,把时间拆开来处理
12. Q: CNN和RNN的区别? A: RNN的话权重随着时间增长是不断传递的,随着时间传递的增加,前面的权重会越来越小,导致长时间的依赖关系会被弱化
13. Q: 模型预测的bad case有做分析吗? A:一方面可能是我没有对陆地的温度和盐度做mask,陆地的输入会对预测结果产生影响,会影响长时间预报的准确性 A:一方面是因为我用的是数值模拟的数据,这个数值模拟模型中途有换过模型版本,导致数据不连续,在有跳变的时间预测效果也会差
14. Q: 你用的是什么数值模拟的数据啊?是海洋的数值模拟模型,还是其他领域的模拟模型? A: 用的是一个叫HYCOM的数值模式数据,是海洋的数值模拟模型。
15. Q: 要训练多久?数据多少条? A:我笔记本3070一个epoch训练4小时,数据条数略
16. Q: 你还有什么项目做的比较好的吗? A:还有就是我本科的论文,但那个跟深度学习就没啥关系了,是一个传统的信号处理的项目,我之前看这个岗位叫声学前端还以为是一个偏声学信号处理的岗, 结果还需要深度学习相关的知识 Q:好的,确实咱们这个岗位是大模型相关的,需要深度学习基础

2. NLP相关八股

这块打得稀烂,还是准备不足

1. Q: 大模型你有了解吗? A:不太了解,但我最近有在看一些NLP的论文,加班加点的学习 Q:有了解什么模型吗 A:有看过transformer、BERT,GPT和llama还在看
2. Q: 这些模型的loss有了解吗? A:(支支吾吾)transformer的loss应该是一个Logistic loss(这里回答错了,应该是softmax),BERT的loss也是一个分类的loss,GPT和llama我就不清楚了。 Q:好的,那不问你这些技术上的问题了。

3. 杂项

1. Q: 你觉得你是一个偏科研的人还是一个动手能力比较强的人? A:我觉得我是一个偏科研的人,但在浙大这一年多做的这些写业务代码之类的事情,也培养了我的动手能力 Q:所以你算兼而有之了? A:算是吧
2. Q: 你平时用大模型用的多吗?有用大模型辅助编程吗 A:我一般用vscode里的copilot辅助编程,gemini我也用 Q:你用这些模型有没有什么心得? A:一般来说做一些简单的任务的时候,我会用一些带Fast的模型快速生成,写一些骨干代码的时候,我会用gemini pro
3. Q: 如何了解科研进展 A:略

反问环节

1. Q: 医患对话数据一般都是比较敏感的数据吧?公司内部有服务器吗? A:你是想问我们的服务是部署在公网上的?还是在医院里的吗? Q:这个我也想问? A:部署在医院的服务器上 Q:公司服务器的配置大概如何? A:公司有A800 和 4090卡,我们也会去外面租服务器。
2. Q: 这个业务目前有在医院实际使用吗? A:背景略,我们这个项目目前主要医生问诊的时候将医患对话转文本,提升问诊效率,并且还能将对话输入大模型自动生成病例
3. Q: 有浙大的同学来这里实习吗? A:有几个同学来过这边,有的已经回去读博了Q Q:这个180/天,是按每个月工作天数算,还是按30天算 A:这个你问HR

结果

面试过了,但要求转岗,转到病例生成部门(传统NLP),还要再面一次HR面,遂放弃。

  • Copyright: Copyright is owned by the author. For commercial reprints, please contact the author for authorization. For non-commercial reprints, please indicate the source.
  • Copyrights © 2022-2026 CPY
  • Visitors: | Views:

请我喝杯咖啡吧~

支付宝
微信