跳转到内容
彼岸论坛
欢迎抵达彼岸 彼岸花开 此处谁在 -彼岸论坛

[程序员] 技术方案讨论,移除实时日志中的敏感数据


小天管理

已推荐帖子

最近遇到一个需求,看起来不复杂,但是也研究了一两天,感觉还是挺有意思的,拿出来一起讨论下

需求:准实时移除实时日志中的敏感数据

几个要求:
1. 每 5 分钟将线上日志中的敏感数据脱敏,例如手机号替换成 *
2. 不改现有的代码逻辑
3. 尽可能的轻量化方案,因此限定系统自带脚本(shell 、perl 、python)
4. 日志文件较大 最大 3G, 每天归档,处理过程不能占用过多机器资源
5. 允许丢掉小批量日志, 尽可能少
6. 系统晚上九点之后,不会有用户使用

中间断断续续研究了四五种方案,结合 chatGPT 写的代码。 最终准备采取的方案:

1. 使用 perl 脚本
2. 每五分钟剪切日志文件的前 20M ,到新文件。 循环切分,数据量不会太大,切分过程丢数据少
3. 用 perl 处理新文件,20M 处理起来还是比较快。过程丢数据少
4. 晚上十一点把今天的日志再进行合并成一个

一起讨论下还有哪些更加优雅方案
意见的链接
分享到其他网站

加入讨论

您现在可以发表并稍后注册. 如果您是会员,请现在登录来参与讨论.

游客
回复主题...

×   粘贴为富文本.   粘贴为纯文本来代替

  只允许使用75个表情符号.

×   您的链接已自动嵌入.   显示为链接来代替

×   您之前的内容已恢复.   清除编辑器

×   您无法直接粘贴图片.要从网址上传或插入图片.

  • 游客注册

    游客注册

  • 会员

    没有会员可显示

  • 最新的状态更新

    没有最新的状态更新
  • 最近查看

    • 没有会员查看此页面.
×
×
  • 创建新的...