XGBoost缺失值引发的问题及其深度分析
背景XGBoost模型作为机器学习中的一大“杀器”,被广泛应用于数据科学竞赛和工业领域,XGBoost官方也提供了可运行于各种平台和环境的对应代码,如适用于Spark分布式训练的XGBoost on Spark。然而,在XGBoost on...
View Article推荐召回算法之深度召回模型串讲
导读:本文来自“深度推荐系统”专栏,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的变化。本文将结合作者在工作中的经验总结,着重于串讲推荐召回层的模型变化。推荐系统的基本架构并不复杂,一般由索引、召回、粗排、精排以及展控几个部分构成。而其中的召回模块(也叫Matching、触发等)则主要负责根据用户和内容特征,从众多的内容库中找到用户可能感兴趣的内容。一般而言召回模型是多路并发...
View Article鸟枪换炮,如何在推荐中发挥AI Lab开源中文词向量的威力?
本文来自“深度推荐系统”专栏,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的变化。本文则结合作者在工作中的经验总结,着重于介绍在推荐系统中如何使用腾讯AI...
View Article号外!Chameleon支持字节跳动小程序啦
前言Chameleon(简写 CML ) 团队秉承"一套代码运行多端,一端所见即多端所见"的初心,在最初支持 web weex wx 三端之后,凭借着多态协议设计思想,灵活的工程化配置,以及跨端标准协议, CML 团队可以很快的扩展新端,比如支付宝小程序和百度小程序。对于字节跳动小程序,考虑到 CML...
View Article中台禁区:为什么最关键的组织架构却鲜少人谈?
如果中台确实是解决企业现有问题的合理方案,那么建设过程中伴随的组织架构问题就是企业需要关心的,比如中台团队的人从哪来?经费从哪来?建设中台之后,业务团队的决策权力是不是被大幅缩减?本文采访了多位中台实践者,揭秘大多数人不愿意公开分享的中台组织架构调整。写在前面中台确实是一个热度极高的话题,InfoQ...
View ArticleLinux系统安全(六):Apache 安全
根据知名互联网服务研究公司Netcraft对2018年2月活跃网站的统计表明,Apache的市场占有率为42.72%,为最高市场占有率的Web服务器软件。对于Apache的安全,我们将重点聚焦在使用HTTPS加密和使用ModSecurity加固以应对应用代码中可能出现的注入漏洞和跨站脚本漏洞。使用HTTPS加密网站2015年12月25日,一份《六公司关于抵制流量劫持等违法行为的联合声明》的出炉让运营...
View ArticleGo编程实战:如何组织代码、编写测试?
当我们开始学习 Golang编程的时候,通常第一步是写一个 Hello World 程序,大概 5 行左右。然后第二步通常是写一个简单的 HTTP 服务器,一般不超过 100...
View Article论 Python 语言的三大短板与解决办法
多年以来,Python语言一直受到性能、应用程序打包以及项目管理三大问题的困扰。好在,解决方案即将到来。虽然Python诞生距今已经有30年左右,但就在过去几年当中,其受欢迎程度开始快速提升并达到旷古烁今的地步。当下,唯有Java及C等顶尖高手能够与之匹敌。另外,Python的普及程度超越了传统编程语言,目前在教学与学术研究当中成为最优编程方法、理想的软件开发起点以及几乎一切技术堆栈的重要组成部分。...
View Article10+ JavaScript数据可视化库
在本文中,我们将为你介绍可以用来构建自己的图表制作工具以及向软件中增添一些图形建模功能的10+款JavaScript库。用于图表制作的10+款JavaScript库(2019版)如今在浏览器中,你可以使用JavaScript渲染任何东西。在先前一篇文章中,我们介绍了一些在线建模工具来直接在浏览器上创建UML(或ER、BPMN…)图表。大部分这些工具使用JavaScript来渲染图形并与之交互。在本文...
View Article月下载量300万的开源库,为2000美元植入安装广告,值吗?
JS Standard是一个月下载量超过300万的流行JS库,该项目在GitHub上也有接近2.2万Star,但其同时也被诟病为误导新手。近期该项目陷入了争议的旋涡,理由是项目团队发现开源模式难以周转,因而选择在安装时植入广告以换取收入。开源+广告,用户说别闹JavaScript Standard...
View Article五大ATM安全漏洞
很少有目标像自动取款机(ATM)那样吸引犯罪分子,与银行或装甲车不同,它有最少的监控而且没有防护装置。因此,ATM成为各种攻击的目标。在欧洲,针对ATM的攻击连续第四年上升,2018年与2017年相比增长了27%。2018年各种攻击造成的损失超过3600万欧元(4050万美元),比2017年增加了16%。...
View ArticleHadoop迎来3.x时代,昔日大数据霸主如何应对云计算挑战?
自2006年诞生以来,Hadoop改变了企业对数据的存储、处理和分析的过程,形成了一个极其丰富的技术生态圈,并在经历了大数据技术高速发展之后,迎来了3.x的时代。本文将按照存储和计算两个方向,分别介绍Hadoop社区当前的热点话题及后续规划。本文整理自堵俊平、谭望达近日在Apache...
View ArticleGeckoView与Android上新的Firefox Preview简介
Mozilla最近在Android Play商店发布了Firefox Preview,这是Firefox Mobile Web浏览器的新迭代版本,它是围绕GekcoView从头开始构建的,GekcoView是一个基于Gecko浏览器引擎的开源Web浏览组件。Firefox Preview并不是要取代Firefox Mobile,后者依然可以通过Android...
View ArticleESLint 在中大型团队的应用实践
引言代码规范是软件开发领域经久不衰的话题,几乎所有工程师在开发过程中都会遇到,并或多或少会思考过这一问题。随着前端应用的大型化和复杂化,越来越多的前端工程师和团队开始重视 JavaScript 代码规范。得益于前端开源社区的繁盛,当下已经有几种较为成熟的 JavaScript 代码规范检查工具,包括 JSLint、JSHint、ESLint、FECS...
View Article