在线问诊 Python、FastAPI、Neo4j — 创建症状节点

在线,问诊,python,fastapi,neo4j,创建,症状,节点 · 浏览次数 : 193

小编点评

**代码功能：** 该代码从 CSV 文件中提取症状数据并创建 CQL 查询，用于将症状与疾病关联。 **步骤：** 1. **数据读取：** - 读取 CSV 文件 `symptom_data.csv`。 - 使用 pandas 读取 CSV 数据并将其转换为列表。 2. **症状提取：** - 使用 `split()` 方法将症状字符串以 ',' 分割。 - 从列表中提取症状。 - 将所有症状添加到一个集合中。 3. **CQL 生成：** - 使用 list comprehension 将症状集合转换为 CQL 查询。 - 遍历集合，构建 CQL 查询字符串。 - 去除最后一个逗号。 4. **执行 CQL 查询：** - 使用 driver 模块连接数据库。 - 使用 execute_write 方法执行 CQL 查询。 5. **数据清理：** - 使用 clear_data 函数清除所有 Symptom 标签数据。 6. **输出结果：** - 将 CQL 查询结果打印到终端。 **代码示例：** ```python import logging import csv from utils.neo4j_provider import driver import pandas as pd logging.root.setLevel(logging.INFO) def generate_cql(): # ... def execute_write(cql): # ... def clear_data(): # ... def main(): # 读取 CSV 数据 df = pd.read_csv('symptom_data.csv') # 生成 CQL 查询 cql = generate_cql() # 执行 CQL 查询 execute_write(cql) # 清除数据 clear_data() if __name__ == "__main__": main() ``` **注意：** - `utils.neo4j_provider` 模块用于与 Neo4j 数据库连接。请确保已安装。 - `symptom_data.csv` 文件应包含一个列名为 `症状`的症状数据。 - 该代码示例仅展示了症状提取和 CQL 生成的部分。实际应用中可能需要添加更多逻辑。

正文

症状数据
创建节点
附学习

电子病历中，患者主诉对应的相关检查，得出的诊断以及最后的用药情况。症状一般可以从主诉中提取。

症状数据

symptom_data.csv
CSV 中，没有直接一行一个症状，主要想后面将症状 => 疾病做关联，最后会在一个 Excel 中表达
所以每行实际对应一个症病，但在创建节点时，会转化成 N个节点（每个 | 号一个节点）

症状
"上下楼梯疼,不能久站,感觉有点肿"
"眼睛胀痛,干涩,畏光,眼胀,眼痛,看东西有时候清楚有时候不清楚"
复制

创建节点

参考创建药品节点。

import logging
import csv
from utils.neo4j_provider import driver
import pandas as pd

logging.root.setLevel(logging.INFO)


# 并生成 CQL
def generate_cql() -> str:
    # cql = """
    #     CREATE (symptom1:Symptom {name: "膝盖疼"}),
    #     (symptom2:Symptom {name: "眼睛酸胀"})
    #     """

    df = pd.read_csv('symptom_data.csv')
    symptoms = []
    for each in df['症状']:
        symptoms.extend(each.split(','))  # 按，号分割成数组，并将每行数据到一个队列里面
    symptoms = set(symptoms)  # 去除重复项

    # 拼接 CQL
    cql = ""
    for idx, item in enumerate(symptoms):
        cql += """(symptom%s:Symptom {name: "%s"}),\r\n""" \
               % (idx, item)
    return "CREATE %s" % (cql.rstrip(",\r\n"))  # 删除最后一个节点的 逗号


# 执行写的命令
def execute_write(cql):
    with driver.session() as session:
        session.execute_write(execute_cql, cql)
    driver.close()


# 执行 CQL 语句
def execute_cql(tx, cql):
    tx.run(cql)


# 清除 Symptom 标签数据
def clear_data():
    cql = "MATCH (n:Symptom) DETACH DELETE n"
    execute_write(cql)


if __name__ == "__main__":
    clear_data()
    cql = generate_cql()
    print(cql)
    execute_write(cql)
复制

附学习

数组 append、extend 区别

import pandas as pd

df = pd.read_csv('../db/symptom_data.csv')

symptoms_extend = []
symptoms_append = []
for idx, each in enumerate(df['症状']):
    sp = each.split(',')
    symptoms_extend.extend(sp)  # 在末尾追加序列的值 结果为 => [X1，X2,X3，X4]
    symptoms_append.append(sp)  # 在末尾追加对接，附加在里面 结果为 => [[X1，X2],[X3，X4]]
    print("%s sp => %s" % (idx, sp))
    print("%s extend => %s" % (idx, symptoms_extend))
    print("%s append => %s" % (idx, symptoms_append))
    print('--' * 20)

print("extend => %s" % (symptoms_extend))
print("append => %s" % (symptoms_append))

复制

源代码地址：https://gitee.com/VipSoft/VipQA