空值特殊处理

This commit is contained in:
yujj128
2025-12-06 18:00:04 +08:00
parent 16583dbb06
commit 0f666f18c1

View File

@@ -124,10 +124,12 @@ class EnhancedDocxExtractor:
spec_coll = ['全日制教育','在职教育'] spec_coll = ['全日制教育','在职教育']
if current_key_cell['text'].replace('\n','') in spec_coll : if current_key_cell['text'].replace('\n','') in spec_coll :
if not value_cell['text']: if not value_cell['text']:
value_cell['text'] = 'False' value_cell['text'] = ""
else: else:
value_cell['text'] = 'True' value_cell['text'] = ''
if not value_cell['text']:
value_cell['text'] = "None"
if value_cell['text'] and (key_row, key_col + 1) not in visited: if value_cell['text'] and (key_row, key_col + 1) not in visited:
# 检查这个值是否与前一个键提取的值相同(可能是合并单元格) # 检查这个值是否与前一个键提取的值相同(可能是合并单元格)
if not self._is_key_duplicate_merged_cell(structure[key_row][key_col]['text'], kv_pairs): if not self._is_key_duplicate_merged_cell(structure[key_row][key_col]['text'], kv_pairs):