The Unified Medical Language System:An Informatics Research Collaboration

Abstract

1986年、国立医学図書館(Nlm)は、コンピュータの医学への応用に対する根本的な障壁を減らすことを目的とした共同研究プロジェクトである統一医療言語システム(UMLS)に取り組むために、大規模な学際的なマルチサイトチームを結成しました。 その具体的な製品、UMLSの知識源、および情報学の分野への影響を超えて、UMLSプロジェクトは、共同研究開発における興味深いケーススタディです。 これは、広く分散した研究グループ間の実質的な協力の強みと課題を示しています。 過去10年間で、コンピューティングと通信の進歩は、UMLSの協力に関連する技術的な困難を最小限に抑え、UMLS知識源の開発、普及、および使用を促進しました。 World Wide Webの普及により、UMLSの作業の焦点である複数の語彙や多くの情報源によって引き起こされる情報アクセスの問題の可視性が向上しました。 UMLSの成果に基づいて構築し、10年以上前にUMLSプロジェクトによって最初に強調された情報学研究の問題についてより多くの進歩を遂げるのに好都合な時が来ました。

この10年間、統一医療言語システム(UMLS)*1は、幅広い分野の多くの情報学研究者の時間、才能、注目を集めてきました。 このプロジェクトは、医療従事者がより良い意思決定を行うのに役立つ情報システムの開発に対する二つの重要な障壁を克服することに焦点を これらの障壁は、異なる情報源および異なるユーザーによって使用される用語の格差、およびユーザーの問い合わせに関連する可能性のある機械可読情報源 UMLSは、異種の機械可読ソースから関連情報を効果的に取得して統合できるユーザーフレンドリーなシステムの開発をサポートします。 この目的を達成するために、UMLSプロジェクトは、システム開発者のために設計された四つの多目的知識ソースを生成し、広く普及しています:メタテサウルス、セマンティックネットワーク、情報ソースマップ、および専門家の語彙と関連する語彙プログラム。2これらの知識の源は多くの異なったシステムおよび環境でテストされ、適用されました。 出版された文献の実質的かつ成長しているボディは、UMLS関連の研究開発の結果を文書化し、議論し、評価します。3

UMLSは、情報技術とヘルスケアの提供における巨大な変化の十年を通じて、大規模な分散研究開発プロジェクトとして進歩してきました。 その具体的な製品と情報学の研究と実践への影響を超えて、UMLSは共同研究と開発における興味深いケーススタディです。 本稿の目的は、UMLSプロジェクトがどのように開始、実施、管理されたかを説明し、その長寿、成果、未完成の事業に貢献した重要な要因について議論するこ

UMLSプロジェクトの起源

これの目的は次のとおりです。program…is 医学におけるコンピュータの適用に対する最も基本的な障壁、すなわち医学における標準的な言語の欠如を解決すること。 私たちは、その語彙、生物医学文献と患者の観察との間を横断する言語、学校での教育アプリケーション、それらの領域が相互に関連することを可能にす4

—Donald A.B.Lindberg,M.D.,March19,1985

これらの言葉は、UMLSプロジェクトを米国に紹介しました。 1986年、国立医学図書館の予算審議会に出席した。 この声明は、1984年にNLMのディレクターに就任したときにリンドバーグ博士がもたらした概念の最初のレベルの洗練を反映しています。 語彙問題を解決するための具体的なUMLSアプローチは、今後数年間で進化するでしょう。 1985年、NLMは、高度なコンピュータベースの意思決定支援を日常的な患者ケアに統合しようとする試みにおいて、医療情報学者が遭遇する困難の根本的な原因の一つを対象とした長期的な研究開発プログラムのための議会の支持を求めていた。 UMLの構築、特にそれを維持する作業は、学術部門や短期研究助成金の収集が達成することが期待できるものを超えていると説明されていました。 したがって、そのようなシステムの開始、資金調達、および最終的には維持は、連邦研究機関の合理的な事業として提案されました。

UMLSプログラムは、IAIMSを補完し、支持するものとして提示されました:”統一された医療言語システムは、統合された学術情報管理システム(IAIMS)の究極の成功 現在開発中の様々なIAIMSシステムは、診療所や病院、教室、図書館、行政センター、リモートネットワークやデータベース内の既存の情報リソースを統合し、リンクしようと”5

UMLSを開発するためのケースは説得力のある証明し、議会はUMLS関連の研究開発のためのNLMのFY1986予算に$1百万を追加しました。 そのお金は、特にUMLS作業のために充てられたNLMの基本予算への最初で唯一の追加でした。 1986年度には、NLMはリスターヒル国立生物医学コミュニケーションセンターの関連する学内研究予算からUMLSの努力に匹敵する量を割り当てました。 UMLSの研究予算は、プロジェクトに取り組んでいるNLMの人員の費用を除いて、年間約200万ドルであり続けています。 1990年代初頭以来、UMLS関連の研究は、NLMの保健サービス研究情報プログラムと高性能コンピューティングと通信におけるNLMイニシアチブの目的のいくつかを

学外協力者の選択と資金調達

議会が1986年度の資金をUMLSに充当するまでに、内部のNLM UMLS管理チーム6は、プロジェクトを組織するための様々なオプ NLMチームは、医学、生物医学、医療情報学、計算機科学、図書館情報科学、言語学など、多くの分野からの貢献に依存しているUMLS研究の重要な特徴を例示しました。 チームメンバーは、議論中の複雑な問題に補完的かつ相乗的な見解をもたらしました。 メンバーがプロジェクト会議を欠場しなければならなかったとき、重要な視点の欠如は進歩を遅らせる傾向がありました。

当初、NLMは、UMLSが対処しようとしている情報アクセスに対する基本的な障壁を克服するために、強力な外部研究協力者が必要であると仮定しました。 これらの協力者を選択し、資金を供給するためのメカニズムはあまり確実ではありませんでした。 様々な選択肢を検討した後、NLM UMLSチームは、学外UMLS研究協力者に資金を提供するための最も適切な手段として、”タスクオーダー”研究契約を選択しました。 タスクオーダーの研究契約には、契約の期間を通じて定義され、交渉される一連の研究タスクが含まれます。 このメカニズムにより、NLMと共同で研究の質問や方法を調整し、関連する問題や健康情報環境の変化の理解を向上させることができました。 対照的に、”定期的な”研究開発契約は、特にプロジェクトの最初の探索段階で、想定されている分散型および進化的研究努力には不適切な特異性のレベ 定期的な研究助成金や協力協定を含む助成金メカニズムは、NLMに複数の研究協力者の努力を調整するにはあまりにも少ない緯度を与えました。

UMLS契約に入札する可能性が高かった大学ベースの情報学研究グループのためのタスクオーダー研究契約メカニズムにはいくつかの欠点がありました。 1986年には、ほとんどの医療情報学の研究者は、任意のタイプの研究契約を支配する規則や規制に慣れていなかったし、彼らの事業所でさえ、タスクオーダー契約に慣れていませんでした。 タスク-オーダー契約はまた、研究者の自律性を制限し、NLMが落札者の研究関心や議題に合わないタスクを発行する可能性があるという妖怪を提起しました。 図書館はこれを行うつもりはなかったが、契約メカニズムはそれを許可していただろう。

UMLSの概念が最初に議会に提示された約一年後、NLMは、タスクオーダー研究支援契約のための提案(RFP)の要求を発行しました”…UMLSとその関連製品を作成するた”7RFPは、”生物医学情報への効果的な統合されたアクセスへの主な障壁は、主要な情報源で使用される分類および表現スキームの驚異的な配列である: 出版された生物医学文献、患者の記録、医学的に関連するデータバンク、および医学知識ベース。”7それはまた取られるべきアプローチについてのNLMの思考の付加的な洗練を反映した:”この基本的な医学情報問題への解決は異種の分類の機構間の概念的なリンクの開発である。…. 実用的な結果は、メッシュと他の医学的に関連するthesauriだけでなく、分類と情報源の広い範囲で利用可能な医療情報へのアクセスを支援する関連製品をリンクし、メタテサウルスになります。”7

RFPは、落札者にタスクが割り当てられるいくつかの分野を概説しました。 これらには、ユーザー情報のニーズ、これらのニーズに関連する機械可読情報のソース、UMLSコンポーネントの機能要件、これらのコンポーネントの代替構造と開発ア 提案者は、UMLS全体の目標に関連する研究のための独自のアイデアを提示する必要があり、多くの入札者には理解できないほど、実行するように求めら UMLの目標と契約メカニズムに関する予約についての混乱にもかかわらず、NLMはRFPに対応して多くの優れた提案を受けました。 これらのいくつかは、Massachusetts General HospitalのMicroMeSH、8A User-friendly graphical browser for The Medical Subject Headings vocabularyなど、NLMのUMLSプロジェクトに関する考え方に影響を与えた既存の作業を反映しています。

すべてのNIH研究契約に必要なように、提案は、主に非政府の専門家で構成される特別に招集された技術レビューグループによって評価されました。 技術交渉と関連予算の調整のラウンドの後、1986年にNLMは七つの異なる医療情報学研究グループを含む四つの二年間のUMLS研究開発契約を授与しました。 これらは、一般的なUMLSの研究開発のために特別に発行された競争的に授与されたタスクオーダー研究契約の三つのラウンドの最初のものであり、他のものは1988年と1991年に授与された。 1992年と1995年に、NLMは、追加の機関でのUMLS知識ソースの適用を容易にするために、より小さな競争力のある発注書を発行しました。 1993年から、NLMは、その高性能コンピューティングと通信プログラムの一環として発行された研究契約と協力協定の助成金の下で、いくつかのUMLS関連の研究 これらの様々なメカニズムを通じて、多くの研究者や機関は、UMLS研究のためのNLMの資金を受けています。9

1986年以来、UMLSプロジェクトは、NLM研究訓練助成金を持つ多くの機関で医療情報学フェローの連続の才能の恩恵を受けてきました。 いくつかのケースでは、UMLSの仕事は大幅に彼らのその後のキャリアや研究の関心に影響を与えています。 最初に研修プログラムのフェローとしてUMLSの研究に取り組んだいくつかは、その後、UMLSの契約や助成金を授与された上で主任研究者や共同研究者にな UMLSプロジェクトの開始時に想定されているように、UMLSコンポーネントは、IAIMSの焦点である統合情報システムに必要なインフラストラクチャの一部を提 多くのIAIMS機関がUMLS研究に直接参加しています。

コラボレーションのためのフレームワークを確立する

12月13日、1986年、新しいUMLS請負業者は、ベセスダでNLMの内部UMLSプロジェクトチームと会い、6ヶ月間隔で8年間開催された一連の一般的なUMLSプロジェクトミーティングとなった。 (これらは、特定のトピックを調査していたUMLS協力者のサブセットを含む小さなセッションによって時々補足されました。)いくつかは、彼らが刺激的で重要な努力を始めていたと思った。 いくつかは、彼らがに自分自身を得ていたか疑問に思いました。 興奮と不安は相互に排他的ではありませんでした。 NLM派遣団は、契約プロセスの最初の結果に満足しており、UMLSプロジェクトに関する実質的な作業に乗り出すことを熱望していました。 彼らはまた、そのような異種で強力なグループをほぼ同じ方向に向かわせることは困難である可能性が高いことを知っていました-特に正確な目的地がまだ明確に定義されていなかったためです。

必然的に、議題には、参加者間のコミュニケーションとコラボレーションの技術的側面の議論が含まれていました。 1986年でさえ、インターネットはUMLSの共同研究者間の日常的なコミュニケーションのための合理的な選択でしたが、ほぼすべてのUMLS研究サイトの研究者の中には、UMLSの参加の一環として初めてインターネット電子メールユーザーになった人もいました。 (当時のディスケット上の)サイト間で機械可読データを交換するためのガイドラインも確立された。 その前のWeb時代には、一般的なハードウェアとソフトウェアのプラットフォームを見つけることの問題は大規模に迫りました。 共同研究者のグループには、MS-DOSパソコン、Macintoshパソコン、Unixベースのワークステーションのユーザーが含まれていました。 いくつかのUMLS参加者はすぐにNLM資金を使用して”エイリアン”マシンを購入し、他の参加者が開発したアプリケーションを使用できるようにします。 いくつかのUMLS請負業者は、その結果がNLMでの研究努力とより互換性があるように、特定のソフトウェアパッケージを使用するように求められました。 少なくともいくつかのケースでは、このアプローチは、タスクの物質に請負業者の進捗状況を妨げるだろう。

知的財産権については、特に、UMLS研究に適用される可能性のあるソフトウェアや知識ベースなどの請負業者の既存の知的財産に関連して、限られた議論 NLMとその共同研究者は、共同研究者の以前に開発された知的財産がUMLSの努力で使用されるために自動的にパブリックドメインに渡されないようにすることに関心を共有しました。 しかし、UMLS契約のデータにおける特別な権利条項は、NLMが資金提供した研究の結果として生成された中央UMLSコンポーネントのコンテンツが米国政府に属

最も複雑なタスクは、UMLS研究の物質に協力する方法を決定することでした。 1987年の第二回UMLS請負業者会議の終わりまでに、実質的な協力のための一般的なパラメータが確立されていました。 本質的には、各UMLS協力者は、二つのタイプの作業に従事しています: nlmおよび他のUMLS協力者と共同で開発されたタスクは、中央のUMLSコンポーネントの定義、構築、およびテスト、およびUMLS研究目標および地域の研究優先順位に関 共同UMLSタスクの例は、UMLSセマンティックネットワークのためのセマンティックタイプとリレーションシップの初期セットの定義でした。10すべてのUMLS研究グループは、この活動に参加し、いくつかは、意味的なタイプと関係の潜在的なセットを識別するために特別に焦点を当てた研究を行 より多くのタイプまたはより多くの関係が必要であるかどうかを含む、ネットワークのほとんどの側面についての意見の違いがありました。 (UMLSセマンティックネットワークの最初のバージョンは、133のセマンティックタイプと37のリレーションシップでリリースされました。)個々の共同研究者によって定義され、実施されたUMLSプロジェクトの一例は、ピッツバーグ大学の医療ラウンドの文脈で生じる医師の情報ニーズの研究でした。11UMLS要件の理解を向上させるために実施されたこのプロジェクトでは、幅広い情報ニーズを特定するために民族誌的技術を使用しました。 ほぼ半分は、知識ベースの情報源または患者と知識ベースの情報の合成によって満たすことができます。 個別に定義されたプロジェクトの別の例では、nlm社内スタッフは、書誌検索実験で使用するために、これらのクエリとの関連性を評価したユーザークエリ12

UMLS請負業者の努力の大部分は、個別に定義された研究プロジェクトに専念していましたが、二つのタイプの活動に割り当てられた努力のレベ 例えば、1989年以降、Lexical Technology,Inc.、設計、開発、およびUMLSメタテサウルスのテストに関連する研究にほぼ完全に焦点を当て、この作業のためのより具体的な競争力のある研究契約の数を受 UMLSプロジェクトの最初の段階は、UMLSの協力者によって特定されたすべての潜在的なアプローチを探索することに意図的に専念していたため、個別に定義されたプロジェクトに重点が置かれていました。 UMLS MetathesaurusとSemantic Networkの一般的な概要が現れ始めると、すべての請負業者は、これらのコンポーネントの初期構造と内容を定義するのに役立つ作業にかなりの努力

UMLSの取り組みが進むにつれて、共同プロジェクトと個々のプロジェクトの区別がぼやけています。 すべての参加者は、UMLSの目的と方法の進化とより良い定義に貢献し、UMLSプロジェクト会議でのアイデアや意見の活発で挑発的な交換の影響を受け その結果、個々の請負業者は、UMLS仮説の開発とテストに直接貢献しながら、地元の利益に対処するプロジェクトを設計しました。 1990年にUMLS Knowledge Sourcesの初版がリリースされた後、NLMが資金を提供したUMLSの共同研究者は、さまざまなアプリケーションでこれらのコンポーネントをテストすることに多大な努力を払った。 目標は、さまざまな目的のための有用性を評価し、その構造とコンテンツに対する望ましい変更と機能強化に関するフィードバックを生成し、集中的に開発された追加のUMLSツールの必要性を特定することでした。 多くの例の1つを引用するために、Yale School of MedicineのPsychtopix14は、精神医学の居住者が患者サービスに関する臨床相談を行うのを支援するために、自動化されたMedline検索の早期の成功したデモンストレーションを提供しました。 このプロジェクトは、アメリカ精神医学会の精神-行動障害の診断-統計マニュアル(DSM)からメタテサウルスに語彙を組み込むことを促し、またNLMの感謝Med検索エンジンに特別な目的のインターフェイスをリンクする可能性をテストした。

プロジェクトの重要な決定を下す

プロジェクトの開始から、NLMは、UMLSがライブラリのMedical Subject Headings(MeSH)またはMedlineに似た定期的に配布され、保守された製品 主にこの理由のために、NLMはそれ自身のために中央に開発されたUMLSの部品の特徴に関する最終的な意思決定力予約した。 決定は、多くの場合、反復プロセスの結果でした。 まず、NLMは、作業の要素の評価とすべてのUMLS参加者の勧告に続いて基本的なアプローチを選択します。 これは、異なる基本的なアプローチを強く支持している可能性のある人を含む、すべての協力者によって議論され、洗練され、必然的に改善されるで 幸いなことに、NLMは、nlmとの明白な不一致に直面しても、nlmの最終的な決定を改善し、支援するために最善の努力を適用する意欲を持って、彼らの勧告を押すことに永続性を組み合わせた協力者に恵まれていました。

反復的な意思決定の重要な例は、UMLS Metathesaurusとセマンティックネットワークの一般的なパラメータの初期定義でした。 これらの決定が行われた時点で、カリフォルニア大学サンフランシスコ校の研究者の仕事(後にLexical Technology,Inc.)、機械可読医療情報の既存のソースの内容を利用するための自動字句処理方法の使用15は、スケーラブルで保守可能なアプローチに対するNLMの関心と密接に 他のUMLSの共同研究者による初期の研究では、既存の語彙からの用語をマッピングできる潜在的な「標準形式」としての概念の新しい形式表現の作成に16-18医療概念のより堅牢な機械可読表現が、異種の情報源からの情報の検索と統合を支援するという仮説は、魅力的であった(そして魅力的である)。 しかし、NLMの見解では、初期のUMLSの研究でテストされた方法は、UMLSメタテサウルスに必要な範囲まで拡張可能ではなく、結果が医学的概念を体系化する以前の努力よりも必然的に一般的に受け入れられることは明らかではなかった。 カリフォルニア大学サンフランシスコ校の提案では、選択された生物医学的語彙のすべての単語の辞書の計算から始まるメタテサウルスを構築するための段階的なアプローチがNLMにとってより実用的であるように見えた。 すべてのUMLS協力者によるこの提案の議論と改良が終了したとき、最初のUmls Metathesaurusの定義には、元の提案の最初のステップで提示されたよりも有意に多くの意味論的内容が含まれていた。 第二のUMLS知識源であるセマンティックネットワークの一般的なパラメータも定義した。

これは、UMLS MetathesaurusとSemantic Networkのために作成されるべき新しい知的コンテンツの量に関するNLMとそのUMLS協力者の多くの間の継続的な議論が何であったかを例証 一般的に、ほとんどのUMLS協力者は、よりオリジナルのコンテンツを好む;NLMは、長期的なメンテナンスやリソースの問題に目を向けて、UMLSの目標を達成する UMLSの知識ソースを反復的に改良したいという要望に沿って、ライブラリは、どのコンテンツの拡張が最も有益である可能性が高いかを判断するためのより多くの実験に興味を持っています。 共同研究者は、不合理ではなく、追加のコンテンツが利用可能になるまで、いくつかの実験は意味をなさないと主張している。 彼らは、メタテサウルスのために明示的に詳細な臨床語彙の作成と、臨床システムで使用するための意味ネットワークへのより具体的な意味の種類と関係の追加を推奨する上でかなり一貫していた。

多くのUMLSの共同研究者は、メタテサウルスの範囲をそのソース語彙の組み合わせた範囲と本質的に等しいと定義するNLMの初期の決定に反対した。 彼らは、正当な理由で、1988年に利用可能な機械可読語彙のどれも、患者の記録に必要な詳細な臨床概念の多くを十分にカバーするものではないと主張した。 しかし、NLMは、既存の関連する語彙が組み込まれるまで、メタテサウルスのために明示的に広範な新しい制御語彙の開発に対処すべきではないという立場を取った。 同様に、NLM自体は、米国全体のコンピュータベースの患者記録システムをサポートするために必要な全体の語彙を開発することを約束することができま 図書館は、しかし、保健福祉省によって、この分野でこれまで以上に大きな責任の仮定を奨励することができました。

短期的には、NLMのアプローチは、重要な臨床応用の数のために不十分と見られるコンテンツとUMLSメタテサウルスの初期版につながりました。 長期的な影響はあまり確実ではありません。 いくつかは、情報学の分野は、医療概念の新しいUMLS標準表現の開発によってより良いサービスを提供されているだろうと主張するだろう。 他の人は、最近のNLM/AHCPR大規模な語彙テストの結果と同様に、SNOMED Internationalの開発とリリースとRead臨床分類とメタテサウルスへのそれらの組み込みは、新しい臨床語彙を生成しないように図書館の決定のためのいくつかの検証を提供すると言うでしょう。19NLMが貢献している1996年健康保険の携帯性と説明責任法(HIPAA)の行政簡素化規定を実施するための現在の作業は、臨床語彙の維持と配布のための継続的な

すべてではないにしても、UMLSの決定は、メタテサウルスと意味ネットワークの基本的な特性を定義したものよりも議論の余地が少ないが、他のものは多分野の研究の難しさと利点の両方を示している。 これは、UMLS Metathesaurusのコンテンツ、フォーマット、およびメンテナンスシステムに関連する多くの決定に特に当てはまります。 一般に、NLMおよびLexical Technology,Inc. Metathesaurusのコンテンツやフォーマットの多くの変更は、他のUMLS協力者からの提案に基づいていますが、これらの決定を行うことに主に関与してきました。 フォーマットの変更は、最終的な実装の前にコメントと改訂のために大規模なグループに定期的に循環されています。

NLM and Lexical Technology,Inc.のスタッフ、ほとんどの場合、メタテサウルスの維持のための最終目標に同意します。 彼らは時々、基礎となるソフトウェアシステムのシンプルさと保守性、メタテサウルスのコンテンツの最終的なレビューを担当する人間の編集者の認知負荷を軽減する必要性、毎年メタテサウルスに実質的な追加コンテンツを追加したいという欲求、およびリリーススケジュールを満たすことの重要性の間の即時のトレードオフで異なる。 意見の相違が生じた場合は、Lexical Technology,Inc.、高度な計算機科学の視点を表しています; NLMの視点は、ナレッジワーカーを支援するためのソフトウェアシステムの開発とデータベース製品の生産と流通における経験と、顔の妥当性に対する懸念を反映しています。 異なる視点は、誤解につながる可能性があります。 ある記憶に残る初期の誤解では、Lexical Technology,Inc.”一意識別子”は技術的な意味が限られていると仮定していたが、NLMは実際にはメタテサウルスの概念の永続的な文脈自由識別子を提唱していた。 煙がクリアされると、二つの視点の相互作用は、通常、両側に許容される結果を達成し、多くの場合、どちらかの元の位置よりも優れています。

UMLSと情報技術の進歩

UMLSの努力の根底にある重要な前提は、”情報システムを改善するためには、情報システムを使用しなければならない。 UMLSコンポーネントができるだけ早く実際に使用されるようにするために、最終的に必要とされる機能の一連の逐次近似によって開発されます。 UMLSコンポーネントの初期のバージョンは比較的単純な構造であり、生物医学用語と概念間の相互関係の表現に関して現在のシステムに適度な拡張を提 実際の使用はそれが必要であることを示しているように複雑さは、後続のバージョンで追加されます。 幅広い使用とフィードバックを容易にするために、UMLSコンポーネントのすべてのバージョンは、さまざまなハードウェアとソフトウェアと互換性のある”21 1990年の初版から、UMLSナレッジソースは、実験的契約の条件の下で1990年から96年まで、通常のライセンス契約の下で1997年から、関心のあるすべての国内およ 以前に説明したように、NLMは様々なメカニズムを介してUMLSアプリケーションのための資金を提供してきました。

すべての利害関係者への無料UMLS配布と集中した研究開発努力の目標とされた資金調達の二重戦略は、1990年以来続いています。 システム開発者が利用できる情報技術が向上し、NLMがUMLS知識ソースをよりアクセスしやすくするために新しい技術を使用し、UMLS Metathesaurusとlexical toolsの内容が成熟 この用語はプロジェクトよりも新しいものですが、本質的にUMLSの努力の目的は、多くの異なる健康情報システムで高度な機能を可能にする「ミドルウェア」を構築することです。 最近まで、UMLSプロジェクトは、臨床情報システムの大幅な成長、ハードウェアとソフトウェアの互換性の問題の急激な減少、機械可読な知識ベースの情報源の爆発、高速コンピューティングと通信機能の可用性の向上など、まだ到着していなかった未来のために、このミドルウェアを構築していました。 この未来がかなりの数のシステム開発者にとって現実になる前は、UMLSプロジェクトの目標を把握することは困難であり、UMLSナレッジソースのプロト

この点で、他の多くの場合と同様に、UMLS請負業者が直面する初期の困難は、一般情報学コミュニティでさらに深刻な問題の優れた予測因子でした。 その後、ソフトウェアシステムと技術が使用されているため、既存の運用システムと組み合わせてUMLS知識ソースの使用をテストすることは不可能では すでに述べたように、プロジェクトの開始時には、ハードウェアとソフトウェアの非互換性は、UMLS参加者間の多くのタイプのコラボレーションにとって重 多くのサイトには、リソースを大量に消費するUMLSアプリケーションをユーザーサイトに展開するために使用できるローカルエリアネットワー いくつかの機関は、リモートサーバー上のアプリケーションの効率的な使用をサポートするインターネッ ハードウェアとソフトウェアの非互換性は、多くの場合、良好なインターネットアクセスを持っていた人のための問題でした。 これらの要因は、多くの潜在的なUMLSアプリケーション開発者を落胆させました。 また、UMLSの請負業者によって開発されたプロトタイプアプリケーションの他のサイトでの意味のあるテストを妨げたり、妨げたりしました。

UMLSの請負業者は、UMLSナレッジソースのサイズ、複雑さ、不慣れさも使用を妨げると正しく予測しました。 一部の共同研究者は、NLMは、その使用を容易にするツールの関連セットなしで知識ソースを解放すべきではないと考えました。 ここで再びハードウェアとソフトウェアプラットフォームの問題は、問題を複雑にしました。 UMLSプロジェクトの初期には、プラットフォームに依存しないコードは「技術的には可能」でしたが、実際には実装できないことがよくありました。 特に、どのツールが必要かを予測することが困難であり、UMLSナレッジソースの形式に大きな変更が確実であることを考えると、ライブラリは複数のプラット メタテサウルスを適用しようとする初期の試みは、その初期の関係形式が不明で扱いにくいことを示した。 したがって、1992年版では、リレーショナル形式が大幅に簡素化されました。22メタテサウルスの初期の利用者はすべて、その条件に合わせて索引を構築するためにかなりの時間と労力を費やしました。 これらは品質と洗練さに大きく変化し、自然に矛盾し、比較できない実験結果につながった。 この問題に対処するために、1994年にNlmは、これらのインデックスを生成するために使用された専門のレキシコンとレキシカルプログラムと一緒に、metathesaurusとword、正規化されたword、および文字列のインデックスを配布し始めました。23Metathesaurusインデックスを構築するために使用されるのと同じツールを任意の入力用語に適用することにより、システム開発者はMetathesaurus内の関連情報に外部用語をリンクする可能性を最適化します。 Metathesaurusとセマンティックネットワークと組み合わせて、専門家の辞書と字句プログラムは自然言語処理のための強力なツールです。 それらをUMLSの知識源の一部として含めることは、コロンビア大学のUMLS研究グループの言語学者によって強く推奨されました。

UMLS Metathesaurusのフォーマットの合理化、コンテンツの拡大、umls知識ソースへの語彙リソースの追加の作業が進んでいる間、インターネットへのアクセス、World Wide Webとそのプラ これらの開発は、UMLSの知識ソースへの関心を高め、その使用を簡素化しました。 Webは、現在のUMLSファクトシートとドキュメントを配布するための容易にアクセス可能な手段を提供し、多くの新しいUMLSユーザーは現在、WEB上でUMLSを”発見”します。 UMLSナレッジソースServer24へのインターネットアクセスは、ユーザーがUMLSナレッジソースのコンテンツと形式を探索したり、ローカルソフトウェアに組み込むためのサブセットをダウンロードしたり、ローカルアプリケーションにNLMのサーバーへのアクセスを埋め込むための簡単な方法を提供します。 ライブラリは、CD-Rom上のすべてのUMLSファイルを配布し続けています。 一部のユーザーはまだ良好なインターネット接続を持っていない、と高速インターネットアクセスを持つものであっても、metathesaurusファイルの800メガバイト以上のftpに消極的である可能性があります。

幸いなことに、UMLS Metathesaurusの大規模かつ成長しているサイズは、エンドユーザーアプリケーションの展開にはるかに少ない問題になっています。 この現象の一つの実例は、もともとDOSベースのCoach expert search assistant25のために開発された高度な検索機能を、インターネット経由ではるかに広い聴衆に利用できるようにするNLMの能力である。個々のDOSワークステーションまたはLANサーバー上でCoachアプリケーションをロードしてテストした26人のMedlineユーザーは、その機能に熱心でした; それはメタテサウルスからの情報を組み込んだ主な理由は、しかし、それはほとんどのサイトにマウントするには大きすぎました。 は、大規模なメタテサウルスのファイルと高度な検索機能がNLMの高性能サーバー上に存在し、ユーザーは、Web対応のワークステーションとブラウザのみを必要とします。 新しいバージョンは、すべてのユーザーが即座に利用できるようにすることができます。 何百人もの人々がベータテストのインターネット感謝Medを支援しました。 このような広範なテストは、ソフトウェアのコピーを多くの場所で配布してロードする必要があったときには、非常にリソースを大量に消費しました。 現在の良好な環境では、UMLSメタテサウルスを利用する重要なWebアプリケーションの数が増えています。 例としては、インターネットDXplain、27CliniWeb、28、Medical World Searchなどがあります。29

異種の機械可読情報ソースとの接続と相互作用に関連する厄介な技術的な問題は、JavaとWeb技術、レガシーシステムへのWebベースのインターフェイス、Web上の健康関連情報の急速な成長によって簡素化されました。 インターネットの発展は、ユーザーが利用可能なソースの海から関連情報を見つけて取得するのを助けるというUMLSの目的を達成することの重要性を強調し、 インターネットはまた、潜在的に関連する情報をスキャンして取得する新しいアプローチを奨励しています。 UMLSの共同研究者は、インターネット接続の劇的な上昇やウェブの発明の前に、人間が判読可能で機械解釈可能なオンライン情報源の記述の情報源マッ32それにもかかわらず、これらの劇的な変化は、関連する情報源からの情報の自動選択および検索を容易にする利用可能な機械可読情報源を記述する方法を定義するためのUMLSの努力に一時的に破壊的な影響を与えている。 NLMのスタッフは、Webベースの情報の爆発的な成長の影響を探るために、機械可読情報ソースへの記述とアクセスに関する前提を再検討しています。

情報技術の進歩は、いくつかのUMLSアプリケーションの構築、テスト、および展開の見通しを改善し、他の人のための問題の性質を変えたように、彼らはまた、メタテザウルスの開発とメンテナンスを容易にしました。 Metathesaurusの構築に関与した主要な当事者は、米国の反対側の海岸に存在しています—ワシントンD.C.のNLM、およびLexical Technology,Inc. カリフォルニア州アラメダ出身。 Metathesaurus建設の規模の二つのサイトのプロジェクトのために、論理的なアプローチは、基礎となる保守システムのための共通のプラットフォームを選択し、実 Metathesaurusの構築のバックエンドに関係データベース技術とUnixマシンを使用することについては、本質的に議論はありませんでした。 Ingresは、Lexical Technology,Inc.の経験に基づいて、リレーショナルデータベース管理ソフトウェアとして簡単に選択されました。、このソフトで持っていた。 NlmがMetathesaurusエディタ用のインタフェースの開発を開始したとき、異なるタイプのワークステーションからの編集の基礎を提供し、バックエンドシステムを別のリレーショナルソフトウェアパッケージに最終的に移行するための第4世代言語(Windows4GL)が選択されました。 協力者間の距離と各サイトで行われるタスクの相互依存性を考えると、信頼性の高い高速通信は急速にメタテサウルスを構築するために不可欠にな 1993年初頭、Lexical Technology,Inc. T1接続を導入することで、初期ソースのボキャブラリと更新、初期メタセザウルスのレコード、最終編集データをNLMとの間でより効率的に転送できるようになり、コンピューティングリソースへの共有リモートアクセスを容易にした。 高度な通信により、Nlmは分散サイトでMetathesaurus編集インターフェイスをサポートすることもできましたが、これまでは限られた規模でしかありませんでした。 NLM/AHCPR大規模な語彙テストは最近、語彙の開発と維持に関連するタスクのより広い分布のための現在の可能性を実証しました。 UMLSナレッジソースサーバーの機能に基づいて、特別なテストインターフェイスにより、60人以上の参加者が既存の制御された語彙の41,000以上の用語を検索し、5ヶ月間に標準形式でNLMに結果を提出することができました。33

UMLSの影響

UMLSが1986年3月以来、医療情報学研究アジェンダを形成するのに役立った出版された文献文書これは、100人以上の米国の研究に資金を供給してきた予算の大部分によるものである。 多くの分野からの研究者が、他の寄与要因があります。 UMLSの目標は引き続き説得力があります。 技術の進歩は、これらの質問の重要性を減少させることなく、UMLS研究の質問を調査するための方法を改善しました。 長年にわたり、UMLSの知識源は重要な研究開発ツールに成熟してきました。 UMLSプロジェクトはまた、制度間の協力を刺激するためのインセンティブと機会を提供しています。 多くの情報学者(例えば、Evans e t a l.34)UMLSの参加の一環として、実質的な研究協力の報酬と不満への最初の露出を受け、UMLSプロジェクトの外でのコラボレーションを拡張しました。

1990年以来、UMLSプロジェクトは、現在、定期的に彼らの意図された聴衆によって使用されている有形製品の年次版を生産しています。 UMLS製品の価値は、より無関心のオブザーバーによって評価されなければならないが、運用システムの増加する配列は、UMLS知識源または字句プログラムの一つ以上を採用している。 1997年の時点で、世界中の約500の機関と個人が、1997年版のUMLSナレッジソースを受け取るために必要な新しいライセンス契約に署名していました。 ライブラリ自体は、その生産情報検索サービスとその研究プログラムの両方で、重要なUMLSユーザーです。

商業的な臨床情報システムの開発に従事するUMLSユーザーの数はかなり増加しています。 HL7は最近、HL7臨床メッセージング標準の特定の部分に有効な語彙に関する計画された決定を記録し、配布するための適切な手段としてUMLS Metathesaurusを選択し35これら二つの開発は、メタテサウルスが共通かつ明示的なデータベース形式で重要な語彙の大規模かつ増加する数へのアクセスを提供するという事実を反映している。 1997年のバージョンには、331,756の生物医学的概念が含まれており、739,439の異なる用語によって命名され、30以上のソース語彙から命名された。 メタテサウルスは明らかにその起源の語彙の強さに基づいて構築されています。 いくつかのソース語彙生産者は、順番にメタテサウルスの構造やメタテサウルスに存在する接続からのフィードバックを使用して、その用語の形式と内容を強化している。 次世代のメタテサウルスのメンテナンスシステムは、メタテサウルスとそれが包含する語彙との共生関係のためのより良い自動化されたインフラストラクチャを提供すべきである。

その目的と有用性についての意見の違いはさておき、UMLSメタテサウルスの開発は、制御された臨床語彙への関心を高めています。 これは、概念組織、複数の階層的な視点、および埋め込まれた意味のないユニークな概念識別子を含む望ましい語彙機能の理解を拡大しています。 UMLSプロジェクトはまた、語彙の変更を明示的に表現する必要性と、外部で開発された語彙の変更が発生したときにローカルシステムを同期させることに関連する問題についての意識を高めました。37

これらの成果にもかかわらず、いくつかのUMLS目標はまだ達成されていません。 UMLSの全体的な目標は、ユーザーが異種の機械可読ソースから関連する生物医学情報を取得して統合するのに役立つ高度な情報システムを開発しやすくす 十年前、これは説明し、正当化するのが難しかったです。 今日、多くの異なる情報源を検索するときに遭遇する検索の問題は、すべてのWebユーザーによく知られており、デジタル図書館の研究の主要な焦点です。 UMLSプロジェクトは、コンピューティングと通信技術の進歩が複数のデータベースからの効果的な検索の重要性を高めるという事実の早期認識のための信用を主張することができます。 さらに、UMLSの研究は、ユーザークエリの解釈、異なる情報源の言語間のマッピング、および医療自然言語索引付けと検索技術に関連する多くの研究問題のい 有望なスタートの後、複数の情報源からの情報の効果的な識別と検索のために情報源の機械解釈可能な記述が必要とされる程度を決定し、そのような記述がどのように構造化、作成、維持されるべきかを決定する際には、あまり進歩していない。 これは、NLM、他の健康科学機関、および一般図書館および情報科学コミュニティにおける現在の研究の対象です。

UMLSは、自動化された臨床記録に記載されている患者の状態に直接関連する知識ベースの情報を取得し、統合する能力の開発に特に重点を置いています。 自動化された患者データと知識ベースの情報との間のリンクを含む深刻な調査とプロトタイプシステム開発の多くは、UMLSの庇護の下で行われており、38はしばしばUMLSコンポーネントを使用している。 この重要な研究にもかかわらず、UMLSに関連する誰も、臨床情報と知識ベースの情報の効果的なリンクを取り巻くすべての重要な研究問題が探求されていると主張することはなく、そのような機能が臨床情報システムの主流に達していることはおろか

幸いなことに、UMLSの目標を進歩させるための環境は決して良くありませんでした。 高度なコンピューティングと通信機能は、より安価で一般的に利用可能です。 Web環境では、複数の情報源からの情報の検索に関する研究開発が遅れていた技術的な問題の多くが排除されています。 多くのインターネットにアクセス可能な情報源から情報を抽出することへの関心は、新しい検索方法とアプロー コンピュータ化された患者記録システムは、知識ベースの情報源への堅牢なリンクを可能にするのに十分な臨床データを含むポイントに到達し始め UMLS Metathesaurus、Semantic Network、SPECIALIST lexicon、およびlexical programsの内容は、臨床情報と知識ベースの情報をリンクする問題により適用可能に拡大していますが、これらのツールのより協調的な使用とフィードバックがまだ必要です。 この時期は、10年前にUMLSプロジェクトによって最初に強調された医療情報学研究の問題に関する新たな協力と拡大のための好都合な時期です。

著者は、UMLSの成果への貢献と、会社の喜びとインスピレーションのために、多くのUMLS同僚に感謝します。

統一された医療言語システム

Meth Inf Med
1993

;

32

:

281

91

2

現在の説明、文書化、およびUMLSナレッジソースの取得に関する情報は、NLMのWebサイトから入手できます。www.nlm.nih.gov…..

3

UMLS関連の研究に関する1986-96年に出版された論文の包括的な参考文献。

セルデン
CR
Humphreys
BL

を参照してください。

統一された医療言語システム

医学における現在の参考文献
1997

;

8

:

96

4

労働、保健、福祉、教育、および関連機関の部門1986年の予算: 第99回衆議院予算委員会の労働-保健-福祉-教育-関連機関分科会前の公聴会。、第1セス。 パート4B,(857)(1985)(博士の声明.ドナルドA.B.リンドバーグ,医学の国立図書館のディレクター).

5

労働、保健、福祉、教育、および関連機関の部門1986年の予算: 第99回衆議院予算委員会の労働-保健-福祉-教育-関連機関分科会前の公聴会。、第1セス。 パート4B,(896-7)(1985)(博士の声明.ドナルドA.B.リンドバーグ,医学の国立図書館のディレクター).

6

最初の3人の著者に加えて、プロジェクトの寿命にわたってNLMのUMLS管理チームが含まれています:*William T.Hole、MD、*Lawrence C.Kingsland、III PhD、Daniel R.Masys、MD、*Alexa T. McCray,PhD,*Stuart Nelson,MD,Roy Rada,MD,PhD,*R.P.C.Rodgers,MD,And Peri L.Schuyler,MLS. アスタリスクが先行するものは、チームの現在のメンバーです。 他の多くのNLMスタッフ、特に図書館運営部門の医療主題見出しセクションとリスターヒルセンターの認知科学とコンピュータ科学の支店では、UMLS知識源と字句プログラムの開発とNLMのこれらのツールのアプリケーションに大きな貢献をしてきた。

7

国立医学図書館

仕事の声明

。 In:

統一医療言語システムのための研究支援のための提案のための要求

.

March
28

,

1986

.

MicroMeSH:国立医学図書館の医療主題見出し(MeSH)語彙を検索し、探索するためのマイクロコンピュータシステム

Proc Annu Symp Comput Appl Med Care
1987

;

717

20

.

9

一般的なUMLSの研究開発のための一つまたは競争力のある契約を受けている機関は次のとおりです:ブリガム&女子病院(Robert A.Greenes,MD,PhD,PI)、カーネギー-メロン大学(David A.Evans,PhD,PI)、コロンビア大学(James J.Cimino,MD,PI)、レキシカルテクノロジー、(株) (Mark S.Tuttle,PI)、マサチューセッツ総合病院(G.Octo Barnett,MD,PI)、カリフォルニア大学サンフランシスコ校(Marsden S.Blois,MD,PhD,PI)、ピッツバーグ大学(Randolph A.)、カリフォルニア大学サンフランシスコ校(Marsden S.Blois,MD,PhD,PI)、カリフォルニア大学サンフランシスコ校(Marsden S.Blois,MD,PhD,PI)、カリフォルニア大学ロサンゼルス校(Randolph A. Miller,MD,PI)、ユタ大学(Homer R.Warner,MD,PhD,PI)、およびイェール大学医学部(Perry A.Miller,MD,PhD,PI)。 株式会社レキシカルテクノロジー、また、UMLSメタテサウルスの建設に関連する研究開発のための競争力のある契約の数を受けています。 特定のUMLSの適用のための一つ以上の競争の発注書を受け取った付加的な施設は次のとおりである:American Lake Biomedical Research Institute(Kenric W. ハーバード大学(エリザベス-ウー、MLS、PI)、ジョージタウン大学医療センター(ナオミ-ブローリング、Mls、PI)、ジョンズ-ホプキンス大学(エドウィン-B-ジョージ、MD、PhD、ケビン-ジョンソン、MD、PIs)、ニューヨーク州立大学、バッファロー(ジョン-アイズナー、DDS、PI)、ミズーリ大学、コロンビア大学(E.アンドリュー-バラス、MD、PhD、PI)、ワシントン大学(sherrilynne Fuller,Ph DおよびDebra Ketchell,mls,Pis)。 ベス-イスラエル病院(Charles Safran,MD,PI)、コロンビア大学(James J.Cimino,MD,PI)、インディアナ大学(Clement J.McDonald,MD,PI)、カイザーパーマネンテ(Simon Cohn,MD,MPH,PI)、メイヨー財団(Christopher G.Shute,MD,Dr PH)、オレゴン健康科学大学(William R.Hersh,MD,PI)、ピッツバーグ大学(Henry j.lowe,MD,PI)。 メリーランド大学ボルチモア校(Gary Freiburger,MLS,PI)は、UMLS関連の仕事のためのNLM情報システム助成金を受けました。

UMLSセマンティックネットワークの最初のバージョンのスコープと構造

Proc Annu Symp Comput Appl Med Care
1990

;

126

30

.

医師の情報ニーズ:臨床教育中に提起された質問の分析

Ann Intern Med
1991

;

14

:

576

81

。 /div>

12

スカイラー
PL
McCray
スクールマン
HM
スクールマン
HM
12

Schuyler
PL
McCray
McCray
書誌検索における実験のためのテストコレクション

Medinfo
1989

;

6

(

Pt2

):

910

2

13

Metathesaurus andSemantic Networkは1990年に最初に発行され、Information Sources Mapは1991年に、SPECIALIST Lexicon,lexical programs,and indexesは1994年にMetathesaurusに発行されました。 それぞれは、その導入以来、毎年更新されています。14

Powsner
SM
ミラー
PL
14Powsner
SM
14Powsner
SM
14Powsner
Sm
14Powsner
Sm
医療記録から精神医学文献への自動化されたオンライン移行

メソッドInf Med
1992

;

31

:

169

74

/div>.

UMLS内の語彙間マッピング:字句処理の役割

Proc Annu Symp Comput Appl Med Care
1988

;

201

6

. 16

Cimino
DD
バーネット
GO
16

Cimino
DD
バーネット
GO
16

Cimino
DD
バーネット
GO
セマンティック定義を使用して医療用語間の自動翻訳

MD Comput
1990

;

7

:

104

9

。 出版されたエラータムはMD Computに表示されます。 1990;7:268. /div>

/div>

ワーナー
hr

医療情報の電子交換のためのインターリングア: フレームを使用して臨床語彙間をマップする

Comput Biomed Res
1991

;

24

:

379

400

。 /div>

div>。

統合医療言語システムの概念モデリング

Proc Annu Symp Comput Appl Med Care
1988

;

148

51

.

制御された健康データ用語のカバレッジを評価する:NLM/AHCPR大規模語彙テストの結果に関するレポート

J Am Med Inform Assoc
1997

;

4

:

483

97

.

20

語彙に関連する現在の活動の概要については、次のアドレスにあるHIPAAコードと分類実装Temaのレポートを参照してください。http://www.va.gov/meetings/hhs970709/007/Index.htm。

統一された医療言語システムの構築

Proc Annu Symp Comput Appl Med Care
1989

;

475

80

. 22

Tuttle
MS
Sperzel
WD
Olson
NE

et al. .

Metathesaurusスキーマと配布形式の均質化

Proc Annu Symp Comput Appl Med Care
1992

;

299

303

. 23

McCray
AT
Srinivasan

S

ブラウン
AC
Ac
Ac
Ac
Ac
Ac
AC
AC
Ac
Ac
Ac
Ac
Ac
生物医学用語の変化を管理するための語彙的方法

Proc Annu Symp Comput Appl Med Care
1994

;

235

9

. /div>

stavri
pz

UMLSナレッジソースサーバー:汎用性の高いインターネットベースの研究ツール

。 1996

1996

1996199619961996;

164

8

。 /div>。

Coach:EXPERT searcher環境でUMLSナレッジソースを適用する

Bull Med Libre Assoc
1993

;

81

:

178

83

. 26

Lowe
HJ
Lomax
EC
Polonkey
SE
26

Lowe
HJ
Lomax
EC
Polonkey
SE
26

Lowe
HJ
Lomax
EC
ワールド-ワイド-ウェブ:生物医学情報の配布のための新興のインターネットベースの技術のレビュー

J Am Med Inform Assoc
1996

;

3

:

9

.

27

DXplainに関する情報は、マサチューセッツ州総合病院のコンピュータサイエンス研究所から入手できます。: http://www.lcs.mgh.harvard.edu。

div

Cliniweb:World Wide Web上の臨床情報の管理

J Am Med Inform Assoc
1996

;

3

:

273

80

.

UMLS情報ソースマップの構造と機能

Medinfo
1992

;

7

:

1518

21

。 /div>

div>

powsner
sm

ネットワークベースの環境で関連する情報リソースを選択する:UMLS情報ソースマップ

Medinfo
1992

;

7

:

1512

7

. 32

ロジャース
RPC
32ロジャース
Rpc

32ロジャース

Rpc
複数の異なる情報ソースからの自動取得:World Wide WebとNLMのSourcererプロジェクト

J Am Soc Inf Sci
1995

;

46

:

755

64

。 33

McCray
AT
Cheh
ML
バンガロール
および
et al. .

NLM/AHCPR大規模語彙テストを実施:分散インターネットベースの実験

Proc AMIA Fall Symp
1997

;

560

4

ベル
ds

。 キヤノングループの

医療概念表現言語に向かって

J Am Med Inform Assoc
1994

;

1

:

207

17

. 35

ハモンド
私たち
35

ハモンド
私たち
35

標準的な臨床語彙のための呼び出し

J Am Med Inform Assoc
1997

;

4

:

254

5

. /div>

36

Suarez-Munist
ON
Tuttle
MS
Olson
NE
スアレス-ムニスト
ON
Tuttle
MS
Olson
NE
.

MEME IIは、用語の協力的な管理をサポートしています

Proc AMIA Fall Symp
1996

;

84

8

shortliffe
eh

ガラパゴス:収束医学用語の進化のためのコンピュータベースのサポート

Proc AMIA Fall Symp
1996

;

269

73

38

多くの研究グループによって行われた作業を議論するレビュー記事のために。 see

Cimino
JJ

.

Linking patient information systems to bibliographic resources

.

Meth Inform Med
1996

;

35

:

122

6

.

*

Unified Medical Language System, UMLS, Metathesaurus, Medline, MeSH, and Grateful Med are registered trademarks of the National Library of Medicine.

American Medical Informatics Association

コメントを残す

メールアドレスが公開されることはありません。