XGBoost缺失值引发的问题及其深度分析
背景XGBoost模型作为机器学习中的一大“杀器”,被广泛应用于数据科学竞赛和工业领域,XGBoost官方也提供了可运行于各种平台和环境的对应代码,如适用于Spark分布式训练的XGBoost on Spark。然而,在XGBoost on...
View Article推荐召回算法之深度召回模型串讲
导读:本文来自“深度推荐系统”专栏,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的变化。本文将结合作者在工作中的经验总结,着重于串讲推荐召回层的模型变化。推荐系统的基本架构并不复杂,一般由索引、召回、粗排、精排以及展控几个部分构成。而其中的召回模块(也叫Matching、触发等)则主要负责根据用户和内容特征,从众多的内容库中找到用户可能感兴趣的内容。一般而言召回模型是多路并发...
View Article鸟枪换炮,如何在推荐中发挥AI Lab开源中文词向量的威力?
本文来自“深度推荐系统”专栏,这个系列将介绍在深度学习的强力驱动下,给推荐系统工业界所带来的最前沿的变化。本文则结合作者在工作中的经验总结,着重于介绍在推荐系统中如何使用腾讯AI...
View Article号外!Chameleon支持字节跳动小程序啦
前言Chameleon(简写 CML ) 团队秉承"一套代码运行多端,一端所见即多端所见"的初心,在最初支持 web weex wx 三端之后,凭借着多态协议设计思想,灵活的工程化配置,以及跨端标准协议, CML 团队可以很快的扩展新端,比如支付宝小程序和百度小程序。对于字节跳动小程序,考虑到 CML...
View Article中台禁区:为什么最关键的组织架构却鲜少人谈?
如果中台确实是解决企业现有问题的合理方案,那么建设过程中伴随的组织架构问题就是企业需要关心的,比如中台团队的人从哪来?经费从哪来?建设中台之后,业务团队的决策权力是不是被大幅缩减?本文采访了多位中台实践者,揭秘大多数人不愿意公开分享的中台组织架构调整。写在前面中台确实是一个热度极高的话题,InfoQ...
View ArticleLinux系统安全(六):Apache 安全
根据知名互联网服务研究公司Netcraft对2018年2月活跃网站的统计表明,Apache的市场占有率为42.72%,为最高市场占有率的Web服务器软件。对于Apache的安全,我们将重点聚焦在使用HTTPS加密和使用ModSecurity加固以应对应用代码中可能出现的注入漏洞和跨站脚本漏洞。使用HTTPS加密网站2015年12月25日,一份《六公司关于抵制流量劫持等违法行为的联合声明》的出炉让运营...
View ArticleGo编程实战:如何组织代码、编写测试?
当我们开始学习 Golang编程的时候,通常第一步是写一个 Hello World 程序,大概 5 行左右。然后第二步通常是写一个简单的 HTTP 服务器,一般不超过 100...
View Article论 Python 语言的三大短板与解决办法
多年以来,Python语言一直受到性能、应用程序打包以及项目管理三大问题的困扰。好在,解决方案即将到来。虽然Python诞生距今已经有30年左右,但就在过去几年当中,其受欢迎程度开始快速提升并达到旷古烁今的地步。当下,唯有Java及C等顶尖高手能够与之匹敌。另外,Python的普及程度超越了传统编程语言,目前在教学与学术研究当中成为最优编程方法、理想的软件开发起点以及几乎一切技术堆栈的重要组成部分。...
View Article从Java迁移到Kotlin,这14个App是怎么想的?
在 2017 谷歌 I/O 开发者大会上,谷歌宣布 Kotlin 语言和 Java 一样,成为 Android 应用开发的一级语言。从此,这门由位于俄罗斯的 JetBrain 团队开发的语言开始广受瞩目。Kotlin有着简洁的语法,同时可以与 Java很方便地进行互操作。另外,基于 Android Studio对它的良好支持,不难看出 Google 在向外界证明 Kotlin 在 Android...
View Article为优化Java程序 微软收购JClarity
美东时间8月19日,据外媒VentureBeat报道,微软宣布已收购总部位于伦敦的科技公司JClarity。JClarity是目前流行的Java软件开发平台AdoptOpenJDK项目的主要参与者。微软希望支持JClarity对开源的持续贡献,同时提高Azure上Java的工作负载性能。目前两家公司尚未讨论交易条款。还记得上个世纪,微软与Sun的Java世纪之战吗?现在,时代已经发生了改变。根据Gi...
View Article软件测试职业大洗牌
入行软件测试职业,十年。曾经,入行是一件很简单的事。会点点点,是个正常人,愿意做,就行。反正也对你没太大期望,整个软件开发完了,给测试点一遍,没问题,就可以上线了。所以,给很多同学留下的印象就是:测试职业,门槛低,入门简单。如果找不到工作,或者不想干开发,就来做测试吧。也不知道,后来入行的同学,是从哪里得到的信息。现在还有很多同学,有这类思维。比如:写了几年代码,写不下去了,听说测试简单,先搞几年测...
View Article跟风学新技术 or 修炼基本功,哪个才能真正提升开发者的技能?| 话题
近日,我采访了很多前端技术专家,他们都跟我说了一件相同的事情:前端技术更新太快,大部分前端工程师表现的过于焦虑和浮躁,他们往往盲目跟风学习新技术,却忽略了ES6、JavaScript等前端基本知识的学习。基本功不牢固只是一方面,另一方面大家在技术深度的掌握上也不够好,面试的过程中,只要深入一聊Web 组件、Webpack...
View Article史上最大AI芯片诞生!集成1.2万亿晶体管,面积为Nvidia最大GPU的60倍
据外媒消息,人工智能初创公司Cerebras Systems推出史上最大的半导体芯片——Cerebras Wafer Scale Engine(Cerebras WSE),将专门用于处理人工智能程序。这款芯片的面积为422.25平方厘米,拥有1.2万亿个晶体管、40万个核心,不仅面积是目前最大Nvidia GPU的近60倍,晶体管数量还是后者的50余倍。Cerebras...
View Article银行数字化转型的过程与挑战
“数字化转型”如今已不是什么新鲜概念,但在尼葛洛庞帝1996年书写《数字化生存》、比尔盖茨1999年出版《未来时速》时,数字化还是颇具“科幻”色彩的,毕竟,那是一个手机还没有广泛智能化、电脑性能比较弱、上网也很昂贵的年代。现在,即便是偏远山区,只要网络信号覆盖到,小产量的农产品都能在线销售。“数字化转型”已成为无可争议的发展趋势,大到国家层面的“数字中国”,小到个人层面的“数字生活”,信息网络、信息...
View Article原苹果Siri负责人跳槽微软主管AI团队,巨头间AI竞赛加剧
为苹果效力7年的前Siri首席执行官Stasior的去向终于落定,他将担任微软的技术副总裁,负责领导其人工智能小组。早在5月份,曾有报道指出,Stasior被苹果撤职。至于离开背后的原因,有爆料称系内斗缠绕,也有观点认为,是苹果人工智能战略亟需调整所致。近年来,科技巨头间围绕人工智能的“军备竞赛”打的异常火热,为了在竞争中取得领先优势,他们之间关于顶级AI人才的“争夺战”也持续升级,Stasior从...
View Article昨天讲平台、今天变中台,数据中台都干了啥?
数据中台火的很让人不解,半年前还在炒概念,现在突然就看到各个企业都在宣传自家的数据中台了。这半年,大家热衷于讨论什么是“数据中台”,并且还有“有一千个企业,就有一千个数据中台”的说法,但实际上企业都有“共识”,我们采访了多家企业,想给大家一个准确的“数据中台”定义。为解决数据烟囱而来中国企业的大数据发展大概经历了三个阶段。第一阶段,是 2000...
View Article基于kubernetes的VM解决方案探讨
一、背景eBay从2015年就开始适配kubernetes平台并逐渐部署各个团队的产品。然而eBay仍然部署着很大规模的OpenStack集群。同时管理kubernetes集群和OpenStack集群需要耗费更多的人力和物力。但由于eBay内部还有一部分业务无法迁移到容器,我们能否用一套控制平面(control...
View Article