机器学习/算法校招面试考点汇总（附面试题和答案）-牛客网-牛客企业版-牛客企业服务

#机器学习/算法工程师

面试考点汇总

Tips：

以下不作为机器学习/算法工程师的学习路径，只是汇总的校招机器学习/算法工程师面试考点（因为还有笔试考点，后面结合在一起给大家学习路径），后续会为大家更新10w+字数的机器学习/算法工程师校招面试题库，还有其他岗位的相关题库和资料，想要什么岗位的可以留言哦~

本篇根据各个公司的面试问的问题的大数据进行总结，后面还会更新面试中考察所占比例，当然，本文只包括技术面，不太包括hr面或者一些其他谈人生理想的

▼点击图片可查看大图▼

附题目

一、数学基础

1、微积分

SGD,Momentum,Adagard,Adam原理
L1不可导的时候该怎么办
sigmoid函数特性

2、统计学，概率论

a,b~U[0,1]，互相独立,求Max(a,b)期望
一个活动,n个女生手里拿着长短不一的玫瑰花,无序的排成一排,一个男生从头走到尾,试图拿更长的玫瑰花,一旦拿了一朵就不能再拿其他的,错过了就不能回头,问最好的策略?
问题：某大公司有这么一个规定：只要有一个员工过生日，当天所有员工全部放假一天。但在其余时候，所有员工都没有假期，必须正常上班。这个公司需要雇用多少员工，才能让公司一年内所有员工的总工作时间期望值最大？
切比雪夫不等式
一根绳子,随机截成3段,可以组成一个三角形的概率有多大
最大似然估计和最大后验概率的区别?
什么是共轭先验分布
概率和似然的区别
频率学派和贝叶斯学派的区别
0~1均匀分布的随机器如何变化成均值为0，方差为1的随机器
Lasso的损失函数
Sfit特征提取和匹配的具体步骤

3、线性代数

求mk矩阵A和nk矩阵的欧几里得距离?
PCA中第一主成分是第一的原因?
欧拉公式
矩阵正定性的判断,Hessian矩阵正定性在梯度下降中的应用
概率题：抽蓝球红球，蓝结束红放回继续，平均结束游戏抽取次数
讲一下PCA
拟牛顿法的原理
编辑距离

二、机器学习算法

1、处理分类问题常用算法

交叉熵公式
LR公式
LR的推导，损失函数
逻辑回归怎么实现多分类
SVM中什么时候用线性核什么时候用高斯核?
什么是支持向量机,SVM与LR的区别?
监督学习和无监督学习的区别
机器学习中的距离计算方法?
问题：朴素贝叶斯（naive Bayes）法的要求是？
问题：训练集中类别不均衡，哪个参数最不准确？
问题：你用的模型，最有挑战性的项目
问题：SVM的作用，基本实现原理；
问题：SVM的硬间隔，软间隔表达式；
问题：SVM使用对偶计算的目的是什么，如何推出来的，手写推导；
问题：SVM的物理意义是什么；
问题：如果给你一些数据集，你会如何分类（我是分情况答的，从数据的大小，特征，是否有缺失，分情况分别答的）；
问题：如果数据有问题，怎么处理；
分层抽样的适用范围
LR的损失函数
LR和线性回归的区别
生成模型和判别模型基本形式，有哪些？
核函数的种类和应用场景。
分类算法列一下有多少种？应用场景。
给你一个检测的项目，检测罐装的可口可乐，瓶装的可口可乐作为负样本，怎么弄？
SVM核函数的选择
SVM的损失函数
核函数的作用
SVM为什么使用对偶函数求解
ID3,C4.5和CART三种决策树的区别
SVM和全部数据有关还是和局部数据有关?
为什么高斯核能够拟合无穷维度
第二面完整推导了svm一遍，还有强化学习问的很多，dqn的各种trick了解多少，怎么实现知不知道。
SVM所有核函数的了解应用，SVM的损失函数
LR和SVM 区别
朴素贝叶斯基本原理和预测过程
LR推导
交叉熵，还有个什么熵不记得了。。。
LR公式
交叉熵公式

2、处理回归问题常用算法

L1和L2正则化的区别
问题：Loss Function有哪些，怎么用？
问题：线性回归的表达式，损失函数；
线性回归的损失函数
机器学习：知道哪些传统机器学习模型

3、处理聚类问题常用算法

什么是DBSCAN
k-means算法流程
LDA的原理
介绍几种机器学习的算法，我就结合我的项目经理介绍了些RF, Kmeans等算法。
KMeans讲讲，KMeans有什么缺点，K怎么确定Kmeans
DBSCAN原理和算法伪代码，与kmeans，OPTICS区别

4、推荐系统的常用算法

问推荐算法，fm，lr，embedding
协同过滤的itemCF，userCF区别适用场景
推荐系统的大概步骤，解决冷启动
传统的机器学习算法了解吗
用mapreduce实现10亿级以上数据的kmeans
Kmeans
A/B test如何进行流量分流
协同过滤中的算法怎么细分
FM公式

5、模型融合和提升的算法

bagging和boosting的区别
boosting和 bagging区别
XGBOOST和GDBT的区别
GDBT的原理,以及常用的调参参数
AdaBoost和GBDT的区别,AdaBoost和GBDT的区别
gbdt推导
boosting和bagging在不同情况下的选用
gbdt推导和适用场景
说一下gbdt的全部算法过程
rf和gbdt基分类器区别，里面的决策树分别长啥样，怎么剪枝
随机森林和 GBDT 的区别
xgboost的特征重要性计算
xgboost的正则项表达式
xgboost原理，怎么防过拟合
xgboost，rf，lr优缺点场景。。。
xgboost特征并行化怎么做的
xgboost和lightgbm的区别和适用场景

6、其他重要算法

问题：HMM隐马尔可夫模型的参数估计方法是？
问题：Bootstrap方法是什么？
问题：如何防止过拟合？
EM算法推导，jensen不等式确定的下界

三、机器学习

1、Scikit-learn

Focal Loss 介绍一下
过拟合的解决方法
方差偏差的分解公式
问题：对应时间序列的数据集如何进行交叉验证？
问题：正负样本不平衡的解决办法？评价指标的参考价值？
迁移学习
数据不平衡怎么办?
AUC的理解
AUC的计算公式
生成模型和判别模型的区别
过拟合的解决方法
特征选择怎么做
怎么防止过拟合
L1和L2正则
ID3树用什么指标选择特征
特征工程的问题
给了个链接线上写代码，要求写读文本、文本预处理、特征提取和建模的基本过程，不过写到特征就没写了
softmax公式

2、Libsvm

检测20类物体，多少张训练集，怎么训练
lightgbm优势

3、Keras/tensorflow

MXNet和Tensorflow的区别
Tensorflow的工作原理
Tensorflow中interactivesession和session的区别（手写了tensorflow的图像分类代码，还有问之前线下笔试最后编程题的思路，算法复杂度，然后项目也问。

四、深度学习

BatchNormalization的作用
梯度消失
循环神经网络，为什么好?
什么是GroupConvolution
什么是RNN
训练过程中,若一个模型不收敛,那么是否说明这个模型无效?导致模型不收敛的原因有哪些?
图像处理中锐化和平滑的操作
VGG使用3*3卷积核的优势是什么?
Relu比Sigmoid的效果好在哪里?
问题：神经网络中权重共享的是？
问题：神经网络激活函数？
问题：在深度学习中，通常会finetuning已有的成熟模型，再基于新数据，修改最后几层神经网络权值，为什么？
问题：画GRU结构图
Attention机制的作用
Lstm和Gru的原理
什么是dropout
LSTM每个门的计算公式
HOG算法原理
DropConnect的原理
深度学习了解多少，有看过底层代码吗？caffe,tf?
除了GMM-HMM，你了解深度学习在语音识别中的应用吗？
用过哪些移动端深度学习框架？
Caffe：整体架构说一下，新加一个层需要哪些步骤，卷积是怎么实现的，多卡机制，数据并行还是模型并行？
HOG算子是怎么求梯度的
BN层的作用，为什么要在后面加伽马和贝塔，不加可以吗
梯度消失，梯度爆炸的问题，
Adam
attention机制
RNN梯度消失问题,为什么LSTM和GRU可以解决此问题
GAN网络的思想
1*1的卷积作用
怎么提升网络的泛化能力
什么是seq2seq model
激活函数的作用
为什么用relu就不用sigmoid了
讲一下基于WFST的静态解码网络的语音识别流程？
目标检测了解吗，Faster RCNN跟RCNN有什么区别
SPP，YOLO了解吗？
梯度消失梯度爆炸怎么解决
RNN容易梯度消失，怎么解决？
LSTM跟RNN有啥区别
卷积层和池化层有什么区别
防止过拟合有哪些方法
dropout咋回事讲讲
relu
神经网络为啥用交叉熵。
注意力公式
论文flow情况
Flappy.Bird开发者,怎么利用DNQ方法强化学习你的游戏AI
LeNet-5结构
推导LSTM正向传播和单向传播过程
LSTM原理，与GRU区别
DNN的梯度更新方式
CNN为什么比DNN在图像识别上更好
现场用collabedit写代码，一个怪异的归并算法。。。之前没遇到过，直接把归并写出来，但是说复杂度太高，优化了三遍还不行，最后说出用小顶堆解决了。。。
LSTM和Naive RNN的区别
神经网络为啥用交叉熵。
注意力公式
Inception Score 评价指标介绍
使用的CNN模型权重之间有关联吗？
CycleGAN原理介绍一下
训练GAN的时候有没有遇到什么问题
百度实习：CPM模型压缩怎么做的？有压过OpenPose吗？
用过哪些Optimizer，效果如何
图像基础：传统图像处理方法知道哪些，图像对比度增强说一下
介绍一下图像的高频低频部分，知道哪些图像补全的方法
百度实习：模型压缩的大方向。CPM模型怎么压缩的，做了哪些工作？
Depthwise卷积实际速度与理论速度差距较大，解释原因。
RetinaNet的大致结构画一下
RetinaNet为什么比SSD效果好

五、数据结构与算法

1、查找

手写二分查找
算法题，单调函数求零点 (简单的二分法)
特别大的数据量，实现查找，排序

2、哈希

Hash表处理冲突的方法
一致性哈希
Hash表处理冲突的方法
apriori
KM算法

3、表达式、字符串

中缀表达式转后缀表达式
算法题：翻转中间由各种符号隔开的字符串
问题：A+B∗(C−D)/E的后缀表达式。

4、栈与堆

大顶堆怎么插入删除
堆栈区别
栈溢出有哪些情况

5、树

问题：手撕代码，根据前序，中序创建二叉树。
算法题：从右边看被遮挡的二叉树，求露出的node
算法题，给前序和中序，求出二叉树
算法题，trim二叉搜索树
红黑树

6、排序

对一千万个整数排序,整数范围在[-1000,1000]间,用什么排序最快?
堆排序的思想
冒泡排序
快速排序的最优情况
抽了两道面试题目两道。8个球，1个比较重，天平，几步找到重的？
算法题： topK给出3种解法
快排
说一下小顶堆的调整过程
算法题：2sum，3sum

7、高级算法

手撕代码：以概率p生成1、概率1-p生成0的rand函数，得到0-1等概率的rand函数，计算新的rand函数中：调用一次，while循环的期望次数
Kruskal算法的基本过程
BFS和DFS的实现思想
关联规则具体有哪两种算法,它们之间的区别
贪婪算法
模拟退火，蚁群对比
算法题：名人问题，给出最优解法
代码题：股票最大值。
编辑距离

8、链表

如何判断单链表是否是循环链表
反转链表
算法题，反转链表
算法题，单链表判断是否有环 (leetcode easy)，以及判断环入口

9、数组

找出数组中只出现1次的数，其余数均出现2次，扩展，其余数出现2次以上

10、动态规划

最短描述数，10的最短描述数是3^2+1^2所以是2，求一个数的最短描述数
跳台阶问题，每次只能跳1个台阶或者2个台阶，n个台阶共有多少种方式
动态规划和带记忆递归的区别
手撕代码：0-1矩阵的最大正方形

11、遍历

代码题：股票最大值。

六、编程语言，工具和环境

1、编程语言

什么是python的生成器?
Java抽象类和接口的区别?
python中is和==的区别
python方法解析顺序
strcpy函数
Ctrl+C程序挂掉还是抛出异常,如何判断两个dict是否一样,list头上删除元素,字符串拼接?
pytorch中cuda()作用,两个Tensor,一个加了cuda(),一个没加,相加后很怎样?
python中dict和list的区别,dict的内部实现
C++析构函数
C++的delete,delete[]的区别
C++相关的问题虚函数
如何写多线程的代码
是否关注过caffe和pytorch是怎么写的吗？pytorch调用多GPU函数内核
Java虚拟机内存的划分
python dict按照value进行排序
C++中static关键字的作用
虚函数和纯虚函数的区别
Python多进程
深拷贝，浅拷贝，写一个出来(写了个自己认为对的版本)
在程序里面智能指针的名字是啥？
new，malloc区别
纯虚函数怎么定义，写一个出来
函数后面接const是什么意思？
写一个函数指针
抽象类和接口的区别，慢慢说
有看过c＋＋的一些库吗？
c＋＋你看的最久的一章是哪一章，c＋＋primer最熟哪一章
开发环境语言的掌握
Python多进程
Python锁

2、大数据相关

Spark性能如何调优
map reduce实现笛卡尔乘积
是否写过udf，问udaf，udtf区别和一些细节

七、自然语言处理

1、Word2vec

Word2Vec中skip-gram是什么，Negative Sampling怎么做
FastText和Glovec原理
word2vec实施过程
softmax的原理了解
Wod2vec公式
Wod2vec公式
使用gensim的word similar方法预测句子

八、计算机基础

1、linux

ELF的bss段

2、计算机网络

ip报文经过一个路由器改变哪些字段?
TCP/IP算法,IP寻址

3、操作系统

如何将小端存储模式转为大端存储模式
Python 锁

4、数据库

count(*),count(1)和count(列名)的区别

九、场景题

如何对10亿个词语进行排序,找出频率最高的100个
算法题，10亿个32位正整数，求不同值，只给1GB内存。。。
AI能用在游戏的哪些方面。
如果让我用AI技术怎么加入AI元素
你觉得你的构想能实际实现吗？
那这个技术加进去有什么实际上的意义？

十、项目

项目中涉及的算法有了解情况
模型的搭建，后处理，数据中发现的特征，发现的亮点。
数据量和涉及的算法，效果。
你是怎么处理数据中经常存在的数据不平衡的问题。
考察项目中的roi-pooling
自我介绍
项目介绍
问了下项目怎么做的
问了一下项目和简历
描述一个算法项目从kickoff-落地的全过程
扣项目，问简历，其中涉及的算法和上面差不多
对项目中一些技术选型产生质疑，并友好的一起讨论了这个问题
扣简历的项目，扣的很细
扣简历
扣简历，问得太细了，每个项目都要回答如果再做一次，有什么改进的地方，both算法上和模型选择上
聊简历项目，对搜索推荐算法的了解
简历上聚类项目用到的ISODATA算法比kmeans有哪些改进
自我介绍，
然后让我说一下自己最印象深刻的项目。问我项目的最终成果，分析失败的原因。
主要是问项目，根据项目里问一些细的技术点，比如gan在实际实现中的loss是什么
第五轮面试：主要是问项目
第二轮技术面：两个面试官面我一个。
看过的论文，讨论论文
针对岗位需求和我简历里的内容进行提问
自我介绍
项目经历介绍下
项目中遇到的最大困难
自我介绍
针对简历里的第一个项目问的一些问题
针对项目3，让解释下DOA估计
你的C/C++怎么样？
自我介绍？
谈谈实习项目？
项目难点？
说一下你简历里的图像识别的项目
来问我现在在做什么项目，然后我说OCR，然后介绍了一下
自我介绍
项目经历详细介绍：两种预测方式区别，pair的预测方式，整体项目有哪些可以提升的，遇到的困难之类的，整个项目用了哪些库？
看过的论文，讨论论文
论文flow情况
自我介绍
英特尔实习：项目介绍：台球识别和分类使用的方法，Hough，变换原理，后处理
Kaggle比赛：背景介绍，数据清洗，数据增强，类别平衡，最终成绩，与前几名差距在哪，有没有尝试集成的方法。
GAN小论文：做了什么，最终效果
GAN小论文，做了哪些工作，详细公式推一下，对GAN的具体应用有了解吗？
简历上项目为何适用xgboost和lr，对比其他分类算法的场景优势。
GAN小论文，你做了什么，有哪些改进，在哪些数据集上做过实验，分辨率是多少？
英特尔实习：1）项目背景。台球检测和分类方法，球杆检测方法，球杆遮挡问题怎么处理，不用分类器，直接分割或计算图像差值会怎样？
有什么问题想了解一下

十一、hr面

自我介绍
几点过来的？
你有什么跟别人不一样的？
你的缺点是什么？
家里几口人？
搞技术的你怎么很能说啊？
为什么喜欢杭州？
为什么喜欢菜鸟？
如果你面试失败，你会怎么办？
菜鸟跟你相关的部门？
有女朋友吗？
在哪里工作？
从事什么行业？
如果你的岗位有冲突，你会怎么处理？
实习时间，具体什么时候可以开始？
你有什么想问的吗？
有没有男朋友呀，意向地点是哪？
对公司有哪些了解
兴趣爱好，意向地点
hr面就是常见的问题，城市啊，薪资待遇啊，对部门的评价，对总监的评价
自我评价优缺点，怎么改进
hr抠了简历细节，问了笔试试卷相关的问题（为什么工科生要选择做文案卷，笔试题目印象比较深的是什么等等）还有自己的职业规划等
想去的工作城市
考研还是保研，为什么考到这个学校
研究生期间最大的改变是什么
四六级成绩
讨论下工作地点和期望薪资
你三年的职业规划是什么？
你和周围的人比你的优势在哪？举个例子
考研的还是保研的？为什么没有保研？
家庭成员？家里人对你的工作地点有要求吗？
平时喜欢运动吗？
设计模式会吗？
转岗吗？
平时刷题吗？你刷过最有意思的题是啥，说一哈
我看你之前还做过销售，聊一下
hr面:确定并不是二面说的转岗，而是去做数据挖掘

十一、数据挖掘

开放题:预测一位学生期末是否挂科，需要挖掘哪些信息。

十二、学习与发展

如果有同学要学机器学习，你会建议他们从哪里做起
个人发展，以及对自己项目的深入思考，还有深度学习的发展之类的。
讲很多关于深度学习以及机器学习的具体应用与实现，也谈到了自己在实际工作中遇到的困难。
之后面试官问了些我对人工智能的看法，以及相关竞赛的情况
自我介绍
为什么选择做语音方向？
为什么选择实习，而不是在学校做研究？

答案领取

点击链接进入牛客面试资料馆

领取面试题答案~

https://www.nowcoder.com/interview/center

（建议使用pc端进入，以获取最佳体验）

本资料【持续更新】

点“阅读原文”收藏，随时查看更新