如何面试Python后端工程师?

作者:罗伊 链接:https://www.zhihu.com/question/33398583/answer/59017861 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

更新:讨论区挺热闹,有人说好简单,有人说好难,其实我觉得这只适合面试2~3年工作经验的后端工程师。真的没有问 很难的题目,只是可能你平时没有注意。 在这里我推荐几本书吧 python参考手册,绝对让你更上一层楼 图解密码技术,密码入门不二之选 mysql技术内幕第五版,有点厚当手册读读,要有耐心,高性能mysql也强烈建议读读 effective tcp/ip programming

为什么评论区有这么大差异?我想是个人经历不一样吧,如果是搞web的对操作系统这块和密码技术会偏弱,但如果是系统工程师或是游戏服务端这块会明显偏强。

吃午饭的时候我就一直在想这个问题,我觉得重点不是Python而是后端工程师,因为Python只是系统的一部分,linux基础操作要熟吧,sql要懂吧,消息队列要知道吧,git要熟悉吧......木桶理论,每一环都不能落下,精通其中一两环就更好了。基础功扎实,新东西学得快,代码写得溜,命令敲得顺,bug解的好,妈妈再也不用担心我天天加班了~~~

一.语言

  1. 推荐一本看过最好的python书籍? 拉开话题好扯淡
  2. 谈谈python的装饰器,迭代器,yield?
  3. 标准库线程安全的队列是哪一个?不安全的是哪一个?logging是线程安全的吗?
  4. python适合的场景有哪些?当遇到计算密集型任务怎么办?
  5. python高并发解决方案?我希望听到twisted->tornado->gevent,能扯到golang,erlang更好

二.操作系统 可以直接认为是linux,毕竟搞后端的多数是和linux打交道。

  1. tcp/udp的区别?tcp粘包是怎么回事,如何处理?udp有粘包吗?
  2. time_wait是什么情况?出现过多的close_wait可能是什么原因?
  3. epoll,select的区别?边缘触发,水平触发区别?

三.存储 存储可能包含rdbms,nosql以及缓存等,我以mysql,redis举例 mysql相关

  1. 谈谈mysql字符集和排序规则?
  2. varchar与char的区别是什么?大小限制?utf8字符集下varchar最多能存多少个字符
  3. primary key和unique的区别?
  4. 外键有什么用,是否该用外键?外键一定需要索引吗?
  5. myisam与innodb的区别?innodb的两阶段锁定协议是什么情况?
  6. 索引有什么用,大致原理是什么?设计索引有什么注意点? redis相关
  7. 什么场景用redis,为什么mysql不适合?
  8. 谈谈redis的事务?用事务模拟原子+1操作?原子操作还有其它解决方案吗?
  9. redis内存满了会怎么样?

四.安全 web安全相关

  1. sql注入是怎么产生的,如何防止?
  2. xss如何预防?htmlescape后能否避免xss?
  3. csrf是什么?django是如何防范的?

密码技术

  1. 什么是分组加密?加密模式有哪些?ecb和cbc模式有什么区别?为什么需要iv向量?
  2. 简单说说https的过程?
  3. 对称加密与非对称加密区别?
  4. 如何生成共享秘钥? 如何防范中间人攻击?

五.杂 是否关注新技术啊?golang,rust是否了解?numpy,pandas是啥鸟? 是否紧跟时代潮流?逛不逛微博,刷不刷知乎?

可能你觉得我问的好细,但这好多都是平常经常遇到,并需要解决的,细节更能体现一个人。


语言, gil/mro/metaclass/descriptor/corountin 变着法子问吧,闭包和装饰器可以一块问,当然也可以结合项目经验,如果做过后端api的,几乎没有不用到decorator的吧,说说staticmethod和装饰器的区别啊,写一个bottle绑定 url path的 decorator 或者口述一下原理,等等,这个基础并不一定要对方完全覆盖,但如果都答不上来肯定不行。

系统,对linux有多了解,做服务端开发,poll/select 得知道吧,负载均衡的几种算法要听过把。

通信协议,tcpip http 等等,具体问题比如restfull 风格的api怎么写,网页嵌入的im原理等

工程思维,大局观,个人追求。这个结合对方实际经验来问,问的越犀利越好。抓住项目中的critical point,候选人担任了什么角色,如何去解决,等等。

作者:胡子 链接:https://www.zhihu.com/question/33398583/answer/59158013 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


  • 解释一下 WSGI 和 FastCGI 的关系
  • 解释一下 Gevent 和 threading / multiprocessing 的关系
  • 解释一下 cookie 和 session 的关系,以及 xsrf 的攻击和防范方法
  • 解释一下 Django 和 Tornado 的关系、差别
  • 考考数据库知识,SQL 语法和调优,SQLAlchemy 的用法

作者:匿名用户 链接:https://www.zhihu.com/question/33398583/answer/56372077 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。


作者:老王 链接:https://www.zhihu.com/question/33398583/answer/95330870 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

以上各位都是从面试者的角度答复的,我从被面试者的角度,记录下自己被问到的问题【刚刚从成都到上海找工作】:

先夹带点私货:本人1999年入行,最近3年的项目经验参见这个回答华为的员工工作幸福吗? - 老王的回答中的【1、在华为研发8年的收获是什么:学习新知识的能力】,欢迎推荐上海的python工作机会。个人对这个行业的现状是这样理解的,对年薪30万以下的程序员,没有一组英文关键词搜不到的答案,如果搜不到,就加个stackoverflow试试。从来上海之后的面试过程看,似乎面试官并不认同这个思路。只好重新回到刷题库的方式上,以下为面试问题的整理,持续更新。

1、lock free: 陈硕的《linux服务端编程》里面,讲过一种不加锁的方案:原子级操作,他的muduo库中就有一个实现,用于实现+1操作【两年前看的,如果有误欢迎指正】。 考虑到面试官的python开发背景,应该指的是CAS实现lock free,以下内容参考了乐观的并发策略——基于CAS的自旋 上文中有示意图,我只写下个人理解: 1.1、CAS是Compre And Swap的缩写,意为比较并交换

对于不同线程间共享的数据,在对象/实例中保存一个副本 每次赋值之前,先拿副本和共享数据进行比较 如果结果一致,用一个原子级操作为共享数据赋值【同时,修改副本值】 1.2、CAS的不足: 只能保护一个数值,如果有多个,只能依靠互斥锁来保护 对ABA类的问题,只能靠每次修改都增加版本号来解决【印象中里面讲过多版本的机制】 长期自旋,浪费CPU资源 -- 这一点没看懂,上文提供的示例代码中getAndIncrement函数用了for(;;)

2、对mongodb中文档中的数组类型变量如何加索引: 官方文档:Multikey Indexes stackoverflow上的相关问题:mongodb: Multikey indexing structure? 以及MongoDB索引类型:MongoDB Indexes (part 1)

3、接问题2,面试官问数组类型field,数量达到10万、100万时效率如何? 待续

2016-04-24更新: 上面的内容是4月15号写的。 4月18号面试,两轮面试后当天确定录用,这次面试没问技术细节,这个坑暂时不填了,安利下高票答案推荐的《Python参考手册》。


作为一个写python时间不长但是又一直帮公司面试python后端的人来说,我会问一些简单的问题。

  • 1)怎么写?implementation是最廉价的,随便请一个高中生都能给你写两行,可是是不是pythonic?
  • 2) Decarator
  • 3) Yield/Generator
  • 4) GC
  • 5) 你丫写过最好的一段代码
  • 6)你丫桶过最大的篓子
  • 7)这个也是最重要的,除了python你还会别的么... 我接触过很多号称写了五年python的人,其他东西一概不会,这种人我一般不敢要...
  • 8)碰到过bottleneck么? 怎么解决?

作者:陈满砚 链接:https://www.zhihu.com/question/33398583/answer/59578310 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

results matching ""

    No results matching ""