数据浓缩是收集和存储数据的过程。
数据可以是任何一种可以用数字表示的信息,如姓名、电子邮件地址、电话号码,或者访问者在购买服务时经常访问的页面。
数据丰富也可以指收集和存储数据上下文信息的过程。这些附加信息将利用这些上下文 "丰富 "原始日志。
丰富数据对于为原始数据集提供有价值的业务洞察力至关重要。掌握的数字资产信息越多,就越能更好地识别数据中的趋势和模式,并根据收集到的知识做出业务决策。
数据充实是使用附加信息来扩充或增强所收集数据的过程。附加信息可以存储在不同的存储库中,也可以进行扩充,以提供更多有关来源的详细信息。
例如,如果日志解析器发现记录的事件没有指定国家,它可以查询 GeoIP 数据库,以获得与该 IP 地址相关的国家或城市。
丰富数据的一个重要用例是提供交互的上下文。这种上下文可能包括位置、操作系统、浏览器版本等。
如果日志条目只包含用户 ID 而不包含其姓名或电子邮件地址,则可使用附加信息来丰富日志的上下文,使其包含足够的信息,以便于分析。