【APMCon 2016】新浪微博研发中心资深架构师付稳:新浪微博混合云DCP平台的设计与实践

新浪微博研发中心资深架构师 付稳于基于云架构的性能优化专场发表了题为《新浪微博混合云DCP平台的设计与实践》的演讲,现场解读了微博平台面临的挑战,设计与实现基于Docker的大规模混合云平台DCP以及微博平台Java后端服务应用混合云平台及稳定性实践。

"Facebook发布人工智能引擎Deep Text,背后隐藏的是想成为一个强大搜索引擎的雄心 "

今天,Facebook 推出了一款新的人工智能引擎产品 Deep Text。Deep Text 能够像人一样理解用户在 Facebook 上发布的所有内容和聊天信息的意思。

如何实现基于内容和用户画像的个性化推荐

个性化推荐系统是一门由数据挖掘和机器学习综合的学科,它必须能够基于用户之前的口味和喜好提供相关的精确的推荐,而且这种口味和喜欢的收集必须尽量少的需要用户的劳动。

做好数据挖掘模型的9条经验总结

也许是因为数据挖掘源于实践而非 理论,在其过程的理解上不太引人注意。20世纪90年代晚期发展的CRISP-DM,逐渐成为数据挖掘过程的一种标准化过程,被越来越多的数据挖掘实践者成功运用和遵循。

让地图讲故事的秘密:数据可视化

谈到大数据就免不了谈一下数据可视化,因为大数据挖掘、分析,最终都是要将信息呈现给客户。百度地图的数据体量很大,地图开放平台也有很多大数据分析的相关产品,如百度慧眼、交通云等,都需要对数据进行可视化。

大数据分析的几个极佳用例

时至今日互联网每天新增的数据量达2.5*10^18字节,而全球90%的数据都是在过去的两年间创造出来的。举个直观的例子来说明一下互联网的数据量:假设大西洋里每一升海水代表一个字节的数据,那么整个大西洋存储的数据也只能到2010年就满了。

从“埋点技术已死?”开始说起

大数据时代的到来意味着数据量的爆炸,也意味着收集数据的难度将大幅增加。为了将海量的数据收集起来,埋点技术应运而生。然而随着大数据的发展和深入,用户的要求越来越高,埋点技术开始变得力不从心。