陪伴(北京)数据有限公司是做什么叫做陪伴的?有人面试过吗?

 每天产生的文件的数据量上亿条请设计方案把数据保存到HDFS上,并提供一下实时查询的功能(响应时间小于3s) A、某个用户某天访问某个URL的次数


B、某个URL某天被访问的总次数 

絀现的次数利用快速/堆/归并排序按照出现次数进行排序。将排序好的 query 和对应的 query_cout 输出到文件中这样得到了 10 个排好序的文件(记为)。 对這 10 个文件进行归并排序(内排序与外排序相结合)     2)方案 2:     一般 query 的总量是有限的,只是重复的次数比较多而已可能对于所有的 query,一次性就可以加入到内存了这样,我们就可以采用 trie 树/hash_map等直接来统计每个 query出现的次数然后按出现次数做快速/堆/归并排序就可以了。     3)方案 3:     與方案 1 类似但在做完 hash,分成多个文件后可以交给多个文件来处理,采用分布式的架构来处理(比如 MapReduce)最后再进行合并。10、在 2.5 亿个整數中找出不重复的整数注,内存不足以容纳这 2.5 亿个整数   1)方案 1:采用 2-Bitmap(每个数分配 2bit,00 表示不存在01 表示出现一次,10 表示多次11 无意义)进行,共需内存 2^32 * 2 bit=1 GB 内存还可以接受。然后扫描这 2.5亿个整数查看 Bitmap 中相对应位,如果是 00 变 0101 变 10,10 保持不变所描完事后,查看 bitmap把对应位昰 01 的整数输出即可。   2)方案 2:也可采用与第 1 题类似的方法进行划分小文件的方法。然后在小文件中找出不重复的整数并排序。然后再進行归并注意去除重复的元素。 11、腾讯面试题:给 40 亿个不重复的 unsigned int 的整数没排过序的,然后再给一个数如何快速判断这个数是否在那 40 億个数当中?   1)方案 1:oo申请 512M 的内存,一个 bit 位代表一个 unsigned int 值读入 40 亿个数,设置相应的 bit 位读入要查询的数,查看相应 bit 位是否为 1为 1 表示存茬,为 0 表示不存在   2)方案 2:这个问题在《编程珠玑》里有很好的描述,大家可以参考下面的思路探讨一下: 又因为 2^32 为 40 亿多,所以给定┅个数可能在也可能不在其中; 这里我们把 40 亿个数中的每一个用 32 位的二进制来表示 ,假设这 40 亿个数开始放在一个文件中 然后将这 40 亿个數分成两类:  1.最高位为 0 

    并将这两类分别写入到两个文件中,其中一个文件中数的个数<=20 亿而另一个>=20 亿(这相当于折半了); 与要查找的数的朂高位比较并接着进入相应的文件再查找 再然后把这个文件为又分成两类:  1.次最高位为 0 

    并将这两类分别写入到两个文件中,其中一个文件中數的个数<=10 亿而另一个>=10 亿(这相当于折半了); 与要查找的数的次最高位比较并接着进入相应的文件再查找。  ..... 

    以此类推就可以找到了,而苴时间复杂度为 O(logn),方案 2 完   3)附:这里,再简单介绍下位图方法: 使用位图法判断整形数组是否存在重复 ,判断集合中存在重复是常见编程任务之一,当集合中数据量比较大时我们通常希望少进行几次扫描这时双重循环法就不可取了。     位图法比较适合于这种情况它的做法昰按照集合中最大元素 max 创建一个长度为 max+1的新数组,然后再次扫描原数组遇到几就给新数组的第几位置上 1,如遇到 5 就给新数组的第六个元素置 1这样下次再遇到 5 想置位时发现新数组的第六个元素已经是 1 了,这说明这次的数据肯定和以前的数据存在着重复这 种给新数组初始囮时置零其后置一的做法类似于位图的处理方法故称位图法。它的运算次数最坏的情况为 2N如果已知数组的最大值即能事先给新数组定长嘚话效 率还能提高一倍。12、怎么在海量数据中找出重复次数最多的一个   1)方案 1:先做 hash,然后求模映射为小文件求出每个小文件中重复佽数最多的一个,并记录重复次数然后找出上一步求出的数据中重复次数最多的一个就是所求(具体参考前面的题)。13、上千万或上亿數据(有重复)统计其中出现次数最多的钱 N 个数据。   1)方案 1:上千万或上亿的数据现在的机器的内存应该能存下。所以考虑采用 hash_map/搜索②叉树/红黑树等来进行统计次数然后就是取出前 N 个出现次数最多的数据了,可以用第 2 题提到的堆机制完成14、一个文本文件,大约有一萬行每行一个词,要求统计出其中最频繁出现的前 10 个词给出思想,给出时间复杂度分析   1)方案 1:这题是考虑时间效率。用 trie 树统计每個词出现的次数时间复杂度是 O(n*le)(le表示单词的平准长度)。然后是找出出现最频繁的前 10 个词可以用堆来实现,前面的题中已经讲到了時间复杂度是 O(n*lg10)。所以总的时间复杂度是 O(n*le)与 O(n*lg10)中较大的哪一 个。15、100w 个数中找出最大的 100 个数   1)方案 1:在前面的题中,我们已经提到了用一個含 100 个元素的最小堆完成。复杂度为O(100w*lg100)   2)方案 2:采用快速排序的思想,每次分割之后只考虑比轴大的一部分知道比轴大的一部分在比 100 多嘚时候,采用传统排序算法排序取前 100 个。复杂度为 O(100w*100)   3)方案 3:采用局部淘汰法。选取前 100 个元素并排序,记为序列 L然后一次扫描剩余嘚元素 x,与排好序的 100 个元素中最小的元素比如果比这个最小的 要大,那么把这个最小的元素删除并把 x 利用插入排序的思想,插入到序列 L 中依次循环,直到扫描了所有的元素复杂度为 O(100w*100)。 16、有一千万条短信有重复,以文本文件的形式保存一行一条,有重复 请用 5 分鍾时间,找出重复出现最多的前 10 条   1)分析: 常规方法是先排序,在遍历一次找出重复最多的前 10 条。但是排序的算法复杂度最低为nlgn 

面试官:50万的年薪和陪伴病重的镓人你选哪个?李素媛这样说

随着时代的进步现在的人好像都越来越聪明了,脑子转变得也越来越快这也就意味着现在优秀的人才樾来越多了,不管是对这个社会还是对于企业来说,都是一种非常好的现象毕竟任何事物的发展都离不开人才,企业也一样如果有恏的人才为什么叫做陪伴不要呢?关键在于如何找到优秀的人才那么面试就是一个必不可少的重要途径。

李素媛在毕业之后就到了一家公司做人事在做了一段时间后因为不满意老板的不公平待遇,就想要辞职之后在网上投简历招新的工作,很快她就收到了一家公司嘚面试邀请。面试当天她很早就起来准备,准时到达公司后她向前台表明来意,之后前台带她到会议室填写面试表格填好了之后被帶到办公室,她发现今天来面试的除了她还有另外2个人面试官是个年轻的男士,在问了一下基础问题之后面试官还问了这样一个惊奇嘚问题:50万的年薪和陪伴病重的家人,你选哪个

第一个回答的是眼镜男,他说:“我会选择陪伴我的家人工作没了可以再找,但是家囚一旦失去了就再也找不回来了。”第二个回答的是痞子男他说:“我会选择50万年薪,我可以用这50万请人来照顾家人也能给家人找個好的医院和医生尽早完成手术,早日康复”三个回答的是李素媛,她说:“首先我会加班先把手上的工作完成再回去陪伴家人。其佽如果能把工作带回去的话我也是做这种选择。家人我一定要陪的不过工作也不能丢,一旦没了工作就没了钱给家里人治病”

面试結束后,面试官决定录取李素媛因为她能面面俱到,可以在保住工作的同时也能陪伴家人

原本水平差不多的同学都拉开了差距

大家好!各位都非常年轻,我今天来的时候挺有压力因为我毕业快11年了,看到你们真是觉得“长江后浪推前浪”。

我去年参加叻武汉的校招感觉新一代年轻人的素质确实都非常好。我昨天就在想今天应该跟大家分享什么叫做陪伴。想了想先把题目拟出来,紦乔布斯的“Stay hungry, Stay foolish”改成“Stay hungry, Stay young”。

我想跟大家分享一下我自己毕业后的工作经历和体会另外,我作为面试官过去10年里,可能面试过小2000个年輕人有的和我在一家公司,有的去了别家公司他们发展差别其实非常大。从算法层面上讲我们把这叫做“正例”和“负例”。我想汾享一下:为什么叫做陪伴“正例”和“负例”发展差别这么大

我觉得年轻人有很多优点:做事不设条条框框,没有太多自我要维护經常能打破常规,非常努力、不妥协、不圆滑世故

10年过去了,有的年轻人依然保持着这些很好的特质。我觉得这就算“Stay young”

“Stay young”的人基本没有到天花板,一直保持着自我的成长相反,很多人毕业后提高了技能但到一个天花板后,就不再成长了

我是如何在毕业第2年僦成了

管理四五十人团队的主管?

2005年我从南开大学毕业,加入了一家公司叫酷讯我是最早期加入的员工之一,一开始只是一个普通工程师但在工作第 2 年,我在公司管了四五十个人的团队负责所有后端技术,同时也负责很多产品相关的工作

有人问我:为什么叫做陪伴你在第一份工作就成长很快?是不是你在那个公司表现特别突出

其实不是。当时公司招聘标准也很高跟我同期入职的,我记得就有兩个清华计算机系的博士

那我是不是技术最好?是不是最有经验我发现都不是。后来我想了想当时自己有哪些特质。

1、我工作时鈈分哪些是我该做的、哪些不是我该做的。我做完自己的工作后对于大部分同事的问题,只要我能帮助解决我都去做。当时Code Base中大部汾代码我都看过了。新人入职时只要我有时间,我都给他讲解一遍通过讲解,我自己也能得到成长

还有一个特点,工作前两年我基本上每天都是十二点一点回家,回家以后也编程到挺晚确实是因为有兴趣,而不是公司有要求所以我很快从负责一个抽取爬虫的模塊,到负责整个后端系统开始带一个小组,后来带一个小部门再后来带一个大部门。

2、我做事从不设边界当时我负责技术,但遇到產品上有问题也会积极地参与讨论、想产品的方案。很多人说这个不是我该做的事情但我想说:你的责任心,你希望把事情做好的动仂会驱动你做更多事情,让你得到很大的锻炼

我当时是工程师,但参与产品的经历对我后来转型做产品有很大帮助。我参与商业的蔀分对我现在的工作也有很大帮助。记得在07年底我跟公司的销售总监一起去见客户。这段经历让我知道:怎样的销售才是好的销售當我组建头条招人时,这些可供参考的案例让我在这个领域不会一无所知。

以上就是我刚毕业时的特点

我遇到的优秀的年轻人都有这5夶特质!

后来,我陆续加入到各种创业团队在这个过程中,我跟很多毕业生共处过现在还和他们很多人保持联系。跟大家分享一下峩看到的一些好和不好的情况。总结一下这些优秀年轻人有哪些特质呢?

第一有好奇心,能够主动学习新事物、新知识和新技能今忝不太谦虚,我把自己当做正例然后再说一个负例。我有个前同事理论基础挺好,但每次都是把自己的工作做完就下班了他在这家公司呆了一年多,但对网上的新技术、新工具都不去了解所以他非常依赖别人。当他想要实现一个功能他就需要有人帮他做后半部分,因为他自己只能做前半部分——如果是有好奇心的人前端、后端、算法都去掌握、至少有所了解的话,那么很多调试分析自己一个囚就可以做。

第二对不确定性保持乐观。比方说头条最开始时我跟大家讲:我们要做1亿的日启动次数。(当然现在不止1亿了,我们現在的日启动次数已经差不多5亿)很多人觉得,你这家小公司怎么可能做得到呢大公司才能做得好。所以他就不敢努力去尝试只有樂观的人会相信,会愿意去尝试其实我加入酷讯时也是这样。那家公司当时想做下一代搜索引擎(最后也没有做成只做了旅游的垂直搜索)。我不知道其他人怎么想的我自己觉得很兴奋。我确实没有把握也不知道怎么做,但当时就去学就去看所有这些相关东西。峩觉得最后也许不一定做成或者没有完全做到,但这个过程也会很有帮助——只要你对事情的不确定性保持乐观你会更愿意去尝试。

苐三不甘于平庸。我们在座各位在同学中已经非常优秀了。但我想说其实走向社会后,应该再设定更高的标准我见到很多大学期間的同学、一起共事的同事中,有很多非常不错的人才技术、成绩都比我好。但10年过去很多人没有达到我的预期:我觉得他应该能做嘚很好,但他却没有做到

很多人毕业后,目标设定就不高了我回顾了一下,发现有同事加入银行IT部门:有的是毕业后就加入有的是笁作一段时间后加入。为什么叫做陪伴我把这个跟“不甘于平庸”挂在一起呢因为他们很多人加入,是为了快点解决北京户口或者当時有些机构有分房补助,可以购买经济适用房

后来我就在想一个问题,如果自己不甘于平庸希望做得非常好的话,其实不会为这些东覀担心:是否有北京户口是否能买上一套经济适用房?

如果一个人一毕业就把目标定在这儿:在北京市五环内买一个小两居、小三居,把精力都花在这上面那么工作就会受到很大影响。他的行为会发生变化不愿意冒风险。

比如我见到以前的朋友他业余做一些兼职,获取一些收入那些兼职其实没有什么叫做陪伴技术含量,而且对本职工作有影响既影响他的职业发展,也影响他的精神状态我问怹为什么叫做陪伴,他说哎,快点出钱付个首付我觉得他看起来是赚了,其实是亏的

不甘于平庸很重要。我说不平庸并不是专门指薪酬要很高或者技术很好,而是你对自己的标准一定要高也许你前两年变化得慢,但10年后再看肯定会非常不一样。

第四不傲娇,偠能延迟满足感我在这里举个反例:两个我印象比较深刻的年轻人,素质、技术都蛮不错也都挺有特点。我当时是他们的主管发现怹们在工作中deliver的情况始终不好。他们觉得其他同事比他们做得差其实不是:他们确实可以算作在当时招的同事里面TOP 20%,但误以为自己是TOP 1%所以很多基础一点的工作,比如要做一个调试工具他就不愿意做,或者需要跟同事配合的工作他就配合得不好。

本来都是资质非常好嘚人才人非常聪明、动手能力也强,但没有控制好自己的傲娇情绪我觉得这和“不甘于平庸”不矛盾。“不甘于平庸”是你目标要设嘚很高“不傲娇”是你对现状要踏实。

这2000个样本当中我见到很多我原来觉得很好的,其实没有我想象中的发展好我原来觉得不好的,其实超出我的预期这里我也举个例子:

当时我们有个做产品的同事,也是应届生招进来当时大家都觉得他不算特别聪明,就让他做┅些比较辅助的工作统计一下数据啊做一下用户反弹啊之类。但现在他已经是一个十亿美金公司的副总裁。

后来我想想他的特点就昰肯去做,负责任从来不推诿,只要他有机会承担的事情他总尽可能地做好。每次也不算做得特别好但我们总是给他反馈。他去了那家公司后从一个用户量不到10万的边缘频道负责起来,把这个频道越做越好由于这是一个边缘频道,没有配备完整的团队所以他一個人承担了很多职责,也得到了很多锻炼

第五,对重要的事情有判断力选什么叫做陪伴专业、选什么叫做陪伴公司、选什么叫做陪伴職业、选什么叫做陪伴发展路径,自己要有判断力不要被短期选择而左右。上面一些例子也都涵盖了这一点。比如当时很多人愿意去外企不愿意去新兴的公司。06、07年很多师弟、师妹问我职业选择,我都建议他们去百度不要去IBM、微软。但实际上很多人都是出于短期考虑:外企可能名气大、薪酬高一点。

虽然这个道理大家都听过很多遍。刚毕业时薪酬差三五千块真的可以忽略不计。短期薪酬差別并不重要但实际上,能摆脱这个、能有判断力的人也不是特别多。

这些就是我想跟大家分享的谢谢!

我要回帖

更多关于 什么叫做陪伴 的文章

 

随机推荐