从问答系统到 AI 中间件:云上智能机器人构建之路
问答系统早在1960年代便初见雏形,大致经历了基于结构化数据、基于自由文本、基于问题答案对等阶段,近年来知识图谱、任务型等技术的出现和应用,为问答系统提供了更好的体验与更多的场景。发展多年,问答系统在商业化的过程中仍然面临很多挑战。为了更好地服务丰富多元的智能问答场景,腾讯云构建开放 Bot 市集,打造 AI...
View Article⽕币⽹郑晔:如何成为一名卓有成效的技术管理者?
8 月 24 日,TGO鲲鹏会西安分会 & 成都分会联合举办的“跨蜀道秦岭,成就「技」无止境”分会活动上,火币网首席架构师 & TGO 鲲鹏会会员郑晔进行了题为《如何成为一名卓有成效的技术管理者》的演讲分享。在演讲中,他分享了卓越技术管理者的定义和定位,以及修炼为一名卓越成效技术管理者的几大方式。TGO...
View Article经典分类模型朴素贝叶斯解读 | NLP专栏
贝叶斯分类器在早期的自然语言处理任务中有着较多实际的应用,例如大部分的垃圾邮件处理都是用的贝叶斯分类器。贝叶斯分类器的理论对于理解后续的NLP模型有很大的进益,感兴趣的小伙伴一定要好好看看,本文会详细的讲述贝叶斯分类器的原理。贝叶斯决策论贝叶斯决策论是在统计概率框架下进行分类决策的基本方法。对于分类任务来说,在所有相关概率都已知的情况下,贝叶斯决策论考虑如何基于这些概率和误判损失来预测分类。假设在一...
View Article用于语音识别、分词的隐马尔科夫模型HMM | NLP 专栏
今天介绍自然语言处理中经典的隐马尔科夫模型(HMM)。HMM早期在语音识别、分词等序列标注问题中有着广泛的应用。了解HMM的基础原理以及应用,对于了解NLP处理问题的基本思想和技术发展脉络有很大的好处。本文会详细讲述HMM的基本概念和原理,并详细介绍其在分词中的实际应用。马尔科夫随机过程设随机变量X(t)随时间t(t=t1,t2,t3…tn)而变化,E为其状态空间,若随机变量x满足马尔科夫性,如下:...
View Article百度机器学习课程(二):机器学习如何做?
接下来继续为大家分享机器学习系列课程,第一章的第二节,机器学习如何做:机器如何学习?首先了解下,机器是如何做到学习的。在上一节中,跟大家分享了机器为什么能够学习。那么机器如何一步步做的呢,我想给大家分享一个非常有趣的案例:假设机器可以穿越时空回到17世纪,在17世纪有一个重大的科学发现,就是牛顿的力学三定律。那么我们的机器是否能够学习牛顿学习这个世界的过程?也就是机器能否发现学习到牛顿的力学三定律。...
View Article任务调度系统如何通过隔离提升可用性?
今天聊的任务调度系统,在开源领域中近似的就是Ansible了。Ansible通过在集群上执行命令解决各类业务问题,从而管理千台规模的集群,自身安装和维护都非常简单,因此得到迅速普及,深受运维人员喜欢。下图就是Ansible的典型场景,在Ansible-Server上,对一组机器列表下发指定的命令并回收执行结果,从而完成一次任务的执行。在大型的互联网公司中,任务调度系统多以自研为主,本文希望借助于任务...
View ArticleEtsy结构化数据管理
Etsy最近发表了一篇博客文章,详细介绍了他们如何存储和管理结构化数据。Etsy电商平台,以贩卖独一无二商品为特色。他们登录页面上的口号是:“手工的、复古的、定制的或独特的,尽在Etsy。”这个口号揭示出,独特性是Etsy的卖点。只要商品属于满足这三个条件,就可以在这个市场上贩卖。Etsy的结构化数据组织定义了由类别、属性、值和范围组成的分类法。例如,分类中的某个项目可以有类别“靴子”,属性“女性鞋...
View ArticleiOS 的这5个零日漏洞链已被利用多年
据谷歌威胁分析小组(TAG)工程师Ian Beer报道,有14漏洞几乎影响了从iOS 10到12的所有iOS版本。这些漏洞已经被黑客利用至少2年了。他们通过入侵的网站控制访客设备,窃取了大量私人数据。其中7个漏洞影响了iOS浏览器,5个是内核漏洞,2个是沙箱逃逸。它们被用来创建了5个攻击链,从最初侵入设备(通常是利用浏览器漏洞),到通过攻击取得更高特权级别来访问私人数据。按照Ian...
View Article有赞移动关于权限与审批流程的标准化
一、背景有赞移动有weex发布平台、移动配置中心平台、App分发平台、热修复平台等。这些平台都需要发布,而发布就需要规范化,需要审批制度。如果为各个平台开发这个审批流程,看起来是一种浪费。首先想到第一种方案:接入现有的前后端发布平台。移动侧的发布基本是配置类的发布,跟后端应用和前端应用的发布不一样。后端应用和前端应用的发布都是将指定的内容推送到某台或者多台机器进行部署、启动。两者如果硬要做抽象,成本...
View ArticleJava多线程核心技术(六):线程组与线程异常
本文经授权转载自微信公众号薛勤的博客。本文应注重掌握如下知识点:线程组的使用如何切换线程状态SimpleDataFormat...
View ArticleFlutter和iOS之间的Battle:手势交互听谁的?
跨平台框架都会面对和原生平台沟通的问题,Flutter 也不例外,在实际工程落地的过程中经常会碰到手势识别交互的问题。本文介绍了西瓜视频解决Flutter 和 iOS手势冲突的方案,详细内容如下。Flutter 进阶:处理 iOS 手势冲突背景客户端日常开发中,手势识别是交互设计中不可或缺的功能,为此 Flutter 和 iOS 都提供了一套手势系统,同时,为了让 Flutter 页面融入进 iOS...
View Article深度学习在自然语言处理中的应用发展史 | NLP专栏
本篇介绍深度学习在自然语言处理(NLP)中的应用,从词向量开始,到最新最强大的BERT等预训练模型,梗概性的介绍了深度学习近20年在NLP中的一些重大的进展。在深度学习之前,用于解决NLP问题的机器学习方法一般都基于浅层模型(如SVM和logistic 回归),这些模型都在非常高维和稀疏的特征(one-hot...
View Article一文道尽“人脸数据集”
这一次我将从人脸检测、关键点检测、人脸识别、人脸表情、人脸年龄、人脸姿态等几个方向整理出人脸领域有用的数据集清单,不全也有9成全吧。01人脸检测所谓人脸检测任务,就是要定位出图像中人脸的大概位置。1.1 Caltech...
View Article深度学习中的数据增强方法都有哪些?
很多实际的项目,我们都难以有充足的数据来完成任务,要保证完美的完成任务,有两件事情需要做好:(1)寻找更多的数据。(2)充分利用已有的数据进行数据增强,今天就来说说数据增强。什么是数据增强?数据增强也叫数据扩增,意思是在不实质性的增加数据的情况下,让有限的数据产生等价于更多数据的价值。比如上图,第1列是原图,后面3列是对第1列作一些随机的裁剪、旋转操作得来。每张图对于网络来说都是不同的输入,加上原图...
View Article“看透”神经网络
大家最诟病深度学习的一点就是理论基础不够系统,模型就像一个黑盒子,这就更加凸显了深度学习模型可视化的重要性了。本文以实战经验为主,除去数据的可视化部分,我们说以下几个主要的方向(1)模型结构的可视化(2)卷积参数的可视化(3)激活区域的可视化(4)训练过程的可视化。01模型结构的可视化所谓模型结构的可视化,就是为了方便更直观的看到模型的结构,从而方便进行调试,下面对2个主流的框架进行展示。1.1...
View ArticleTwitter开源遥测工具Rezolus,可用于检测瞬态异常
Twitter工程团队开源了他们的遥测工具Rezolus,该工具可以通过比常规工具更高的采样频率来检测系统性能指标中的异常。...
View Article云原生自动机器学习系统 Katib 的设计与实现
今天,2019 世界人工智能大会在上海开幕,数百位全球 AI 界领军科学家、产业界领袖齐聚黄浦江畔,探索人工智能、机器学习、深度学习在企业、社会中的应用与实践。为了成为国内人工智能应用的第一梯队企业,利用 AI 技术消除垂直行业痛点。近年来,越来越多公司开始尝试利用 Kubernetes 来管理机器学习工作负载。相应的,Kubernetes 原生机器学习库 Kubeflow...
View Article7大最致命的云安全盲点
云计算的好处在其创新性,但近来负责IT安全的各个组织也发现,在这个云越来越普及的时代,网络安全遇到许多障碍。网络安全面临的许多重大挑战都与安全可见性相关,本文介绍了导致这些可见性问题的一些最致命的云安全盲点。当下在提供IT服务的方面,云计算正从一个可选项进化为事实上的标准选项。根据“2019年公共云趋势”,从这份企业战略集团(ESG)的报告来看,IaaS...
View Article