为什么开放数据
本草典的核心定位是「可被引用的双语本体」,而不是「与他人争夺流量的内容站」。在大模型时代,不开放的参考资料终将被静默吞并;唯有公开、可被独立核验、可被他人构建于其上的数据,才能成为长期信任的基础。
我们因此把全部种子数据以结构化 JSON 的形式公开,附带 schema 文档与 SHA-256 校验和,并采用 CC BY-SA 4.0 协议——任何人皆可下载、再发布、再加工,惟须署名「本草典编辑部 / Bencaodian Editorial」并以同样的协议分发其衍生作品。
数据覆盖
本草典是一个正在成长的项目。以下是当前数据集相对于传统典籍标准的覆盖状况:
- 标准本草约 530 味中已收录 335 味(63%)
- 标准腧穴 361 个中已收录 208 个(58%)
- 经典方剂约 300 首中已收录 112 首(37%)
- 辨证证型 80+ 证
- 常见病症 50 症
- 本草-西药相互作用 56 条
持续增长中——欢迎贡献。
下载
v1 · 生成于:2026-04-17T05:37:00.984Zherbs.json1.92 MB · 365 条本草条目(性味、归经、功效、主治、炮制、用量、禁忌、古籍引文、Wikidata 互引)
formulas.json393.2 KB · 112 条方剂条目(君臣佐使组成、加减、治法、出处)
patterns.json245.2 KB · 84 条证型条目(主证、次证、舌脉、病因病机、治则)
meridians.json26.9 KB · 14 条经络条目(十二正经与任督二脉)
acupoints.json448.3 KB · 208 条腧穴条目(定位、刺灸法、特定穴、功效、主治)
classical_texts.json212.7 KB · 38 条古典医籍(作者、朝代、传统、原文条文及注释)
concepts.json212.9 KB · 15 条概念长文(阴阳五行、脏腑、八纲、四气五味、君臣佐使等基础理论)
relationships.json165.6 KB · 1477 条关系图谱(herb_in_formula、formula_treats_pattern、pattern_differential_with 等十余种关系类型)
case_records.json73.5 KB · 28 条古代医案(叶天士、吴鞠通、伤寒论案等历代名家医案)
tongue_states.json34.4 KB · 25 条舌象图谱(舌质、舌形、舌苔与临床意义,含手绘 SVG 路径)
pulses.json44.6 KB · 28 条脉象条目(二十八脉的古典描述、现代描述与临床意义)
symptom_synonyms.json47.3 KB · 155 条症状同义词本体(155 条规范症状,每条含中英文同义词,用于症状检索与证型匹配)
interactions.json58.2 KB · 56 条中药与西药相互作用数据集(含机理、临床建议与文献来源)
conditions.json96.1 KB · 50 条现代疾病与证型对应索引(从西医诊断到中医证型的跨框架检索)
数据形态
每一类条目都以 JSON 数组形式存储,每条记录至少包含 key(稳定标识符)、slug(URL 片段)、name_zh 与name_pinyin。其余字段依条目类型而定(如本草有 nature、flavors、dosage_range,方剂有 composition 含 role 等)。
关系图谱储存于 relationships.json,采用按关系类型分组的结构(如 herb_in_formula、formula_treats_pattern、pattern_differential_with 等)。这种形态便于人工编辑,亦便于以图数据库或 RDF 形式重新表达。
完整的 JSON Schema 描述位于 /data/v1/schema.json。源代码可参见 GitHub 仓库的 src/lib/data/types.ts。
Wikidata 互引
本草、古典医籍与经络条目,凡有可考之 Wikidata Q-ID 者,皆于 JSON 中携带 wikidata_id 字段,并在条目页面的 JSON-LD 中以 sameAs 连接至 Wikidata 词条。这使得本草典之条目可与全球语义网相互引用,亦使大语言模型在引用时有可对接的稳定标识符。
数据稳定性的承诺
key 与 slug 字段一经发布永不更改。下游构建于本数据之上的工具,可信赖这些标识符在十年后仍指向同一份内容。这与 编辑标准 中所承诺的「永久链接」是同一回事。
数据 schema 的破坏性变更须递增 /data/v1/ 目录中的版本号(如未来的 /data/v2/),v1 数据集本身保持冻结。