本文最初发布于 Substack 网站,经原作者 Vicki Boykis 授权由 InfoQ 中文站翻译并分享。
当我们收集太多数据时,会发生什么?
Confluent 的联合创始人、Kafka 的联合创始人 Jay Kreps 写道:日志是从一开始就有的。
日志只是按时间排序的一系列记录。它被配置为允许在末尾追加越来越多的记录,如下图所示:
日志记录了所有的事情。计算环境中有各种各样的日志:
数据类型示例 | 来源 |
---|---|
点击流日志 | Web 服务器、路由器、代理服务器、广告服务器 |
应用日志 | 本地日志文件、log4j、og4net、WebLogic、WebSphere, JBoss、.Net、PHP |
系统日志 | 路由器、交换机、网络设备 |
Windows 日志 | Windows 应用、安全和系统日志 |
其中最重要的是服务器日志,它可以跟踪访问互联网上的内容和应用的计算机。