文件解压处理
2024年8月22日大约 1 分钟
注意
pdfdeal已迁移至NoEdgeAI/pdfdeal,请前往NoEdgeAI/pdfdeal-docs 查看文档
pdfdeal has been migrated to NoEdgeAI/pdfdeal, please visit NoEdgeAI/pdfdeal-docs for documentation
您可能需要安装一些额外依赖以使用:
pip install --upgrade "pdfdeal[rag]"unzips
解压 ZIP 文件并返回提取文件夹的路径。
参数
| 参数 | 类型 | 默认值 | 描述 |
|---|---|---|---|
zip_paths | list | 必填 | ZIP 文件路径列表 |
rename | bool | True | 是否将解压后的 .md 或 .tex 文件重命名为解压文件夹的名称 |
返回值
返回一个包含三个元素的元组 (list1, list2, bool):
list1(list): 提取的文件路径列表- 元素为提取后的文件路径(字符串)
- 如果某些文件解压失败,对应的元素为空字符串
""
list2(list): 错误信息和原始文件路径列表- 元素为字符串,包含错误信息和原始文件路径
- 如果某些文件成功解压,对应的元素为空字符串
""
bool(bool): 处理状态True: 至少有一个文件处理失败False: 全部文件处理成功
注意事项
list1和list2的长度相同- 如果
rename参数为True,解压后的.md或.tex文件将被重命名为解压文件夹的名称,这个功能是为 Doc2X 导出 md 文件设计的
示范代码
from pdfdeal.file_tools import unzips
zips = []
for file in success:
if file.endswith(".zip"):
zips.append(file)
success, failed, flag = unzips(zip_paths=zips)