我跑5 DAG的已经产生的base_log_folder
6GB左右,总的日志数据在个月。我刚刚添加了remote_base_log_folder
,但它似乎并不排除登录到base_log_folder
。删除气流任务日志
反正是有只在远程存储自动删除旧的日志文件,旋转它们或强制气流无法登录磁盘(base_log_folder)?
我跑5 DAG的已经产生的base_log_folder
6GB左右,总的日志数据在个月。我刚刚添加了remote_base_log_folder
,但它似乎并不排除登录到base_log_folder
。删除气流任务日志
反正是有只在远程存储自动删除旧的日志文件,旋转它们或强制气流无法登录磁盘(base_log_folder)?
我不认为有一个旋转机构,但你可以将它们存储在S3或谷歌云存储作为在这里描述:https://airflow.incubator.apache.org/configuration.html#logs
请参阅https://github.com/teamclairvoyant/airflow-maintenance-dags
这个插件有DAG的,可以杀死暂停任务和日志清理。 你可以抓住这些概念,并可以想出一个新的DAG,可以按照你的要求进行清理。
谢谢,我使用的是'remote_base_log_folder'存储上GCS日志文件的远程登录的选项。这会将日志添加到GCS,但不会在本地删除它们。我想我想知道其他人是如何处理大量的日志文件在生产中填满他们的磁盘。 – jompa