データ駆動型サイエンス創造センター

ニュース一覧

News

2016.03.27
news

「第1回電子ラボノートフォーラム」開催のご報告

開催日時

2025年3月11日(火)

開催場所

奈良県コンベンションセンター205,206会議室

主催

奈良先端科学技術大学院大学 データ駆動型サイエンス創造センター

参加者数

132名

【プログラム】

13:00-13:10
NAIST学長 塩崎一祐教授
開会挨拶

13:10-13:12
文部科学省研究振興局参事官(ナノ材担当)付 科学技術・学術行政調査員 寺井智之様
ご挨拶

13:12-13:22
NAIST DSCセンター長 船津公人教授
 「フォーラム開催の目的と位置づけ」

13:22-13:45
NAIST 藤井幹也教授
 「奈良先端科学技術大学院大学におけるRXプラットフォーム構築事業および、電子ラボノートの取り組みについて」

13:45-14:35
Deltablot社CEO Nicolas Carpi様
「eLabFTW by Deltablot」

14:35-15:00
NAIST 高須賀聖五助教
「電子ラボノートを用いた研究活用」

15:00-15:20
NAIST 赤瀬善太郎特任准教授
「NAISTにおける電子ラボノートの活用事例」

15:30-15:55
NIMS ARIMセンターハブ長 松波成行様
「ARIMデータ共用事業の現在と将来展望」

15:55-16:20
早稲田大学 次席研究員 藤波美起登様
「画像認識を用いた科学実験の認識と記録」

16:30-17:20
パネルディスカッション
パネラー:藤井幹也教授、Nicolas Carpi様、松波成行様、藤波美起登様
司会:NAIST 冨谷茂隆教授
「セッション1:データ管理と共用の課題と現状」
「セッション2:実験現場での活用と技術的課題」
「セッション3:電子ラボノートの将来展望とデータプラットフォームとの連携」

17:20-17:30
NAIST DSCセンター長 船津公人教授
総括

詳細および当日の様子

2025年3月11日、標記の第1回電子ラボノートフォーラムが開催されました。本フォーラムでは電子ラボノートを中心に、研究データの記録・管理・共有の現状と課題、さらにAIやデータプラットフォームとの連携可能性について、産官学の多様な立場からの知見が共有されました。以下に、各講演の概要(※フォーラム実行委員会にて作成)と質疑応答の内容についてご報告いたします。

「フォーラム開催の目的と位置づけ」(NAIST DSCセンター長 船津公人教授)

概要
奈良先端大は、RXプラットフォーム構築事業を通じて、設計・合成・計測をつなぐ「RXサイクル」を基盤に、情報の共有と共用による総合知の形成、そして研究の在り方そのものの変革を目指している。次世代材料創成や生命科学研究においては設計、合成、計測をどうつなげるか(RXサイクル)が重要になっている。このサイクルでデータが流れることが重要で、このデータの流れが研究の仕方と人の意識の変革へつながる。データにものを語らせるには、何のために何をしたいのかという、研究者の学術的・社会的視点からの価値観が強く求められる。こうしたRXサイクルにおいて、電子ラボノートは生まれたデータを管理し、属人性を排除するとともに、フィジカルとサイバーをつなぐ新たな研究基盤として機能する。奈良先端大は、RXサイクル実装と電子ラボノート活用による研究の仕方のパラダイム変革を大学・研究機関・産業界とともに推進していきたい。

「奈良先端科学技術大学院大学におけるRXプラットフォーム構築事業および、電子ラボノートの取り組みについて」(NAIST 藤井幹也教授)

概要
近年、巨大な計算リソースによる大規模な科学シミュレーションも行われるようになってきていたが、特に2020年以降はこの流れにロボティクスによる自動実験が加わり、さらにAIが実験計画を担うという時代に突入している。こうした変化に対応すべく、本学では学長直下にRXプラットフォーム戦略推進会議を設置し、全学的にRXサイクルに基づく研究の仕方の変革を目指している。施設環境面では「電子ラボノート」と「リモート計測」の整備を二つの柱として取り組んでいる。電子ラボノートの選定には、いくつか候補があり、実際に試してみた。その中でelabFTWを選択した。2022年度から運用を開始し、2025年2月21時点で18チーム、163名が利用しており、データ駆動型研究の基盤として定着しつつある。一部の研究室では実験データの蓄積と可視化、API連携による実験のループ化に活用されてきている。

質疑応答
Q:研究のループは材料が変わった時に、汎用化できるのか?
A:汎用化は難しい。次の話題となるが、これからは自立型の実験システムを組みたい。実験経路があらかじめ決まっているのではなく、実験機器間での情報交換により、実験内容が自律的に調整されるようなシステムを作りたい。
Q:電子ラボノートへの記述はフリーフォーマットがよいのか?フォーマット化されたものがよいのか?
A:LLMが発展しているのでフリーフォーマットに移行していくのではないか。

「eLabFTW by Deltablot」(Deltablot社CEO Nicolas Carpi様)

概要
次の章立てで電子ラボノートソフトウェア「eLabFTW」の紹介がなされた。
第1章 eLaboFTWというソフトウェア
 機能の説明、信頼性、認証方法について。
第2章 ソフトウェアのセキュリティ
 外部セキュリティ企業によるコード監査やセキュリティ研究者に対するバグ報奨金プログラム、CVE公開による責任ある情報開示などについて。
第3章 オープンサイエンスコミュニティ
 電子ラボノート(ELN)コンソーシアムの創設メンバーである。標準化された交換ファイルフォーマット(eln)などについて。
第4章 DELTABLOT社について
 拠点、顧客、技術パートナーについて。オープンソースプロジェクトを推進。
第5章 研究サイクルの中での電子ラボノート
 LLMと電子ラボノートの関係について。
第6章 プランの選択
 Deltablot社ではSaaSまたはオンプレミスでホストするプランを用意している。

質疑応答
Q:LLMについて、Deltablot社としてはLLMを搭載したeLabFTWをリリース考えはあるのか?
A:いずれは統合していかなくてはならないが、現時点では統合するには市場が若すぎると考えている。
Q:EUでの動向について。ドイツで活発に使われているということだが、どういう理由で使われているのか?
A:この意見が正しいかはわからないが、ドイツは政府がオープンソースソリューション、オープンソースサイエンスを積極的に進めているからではないか。
Q:契約が切れた時にデータを利用することは可能か?PDF以外でも可能か?
A:可能。いろいろなフォーマットで可能。
Q:データがたまった後、検索をしたいが、検索のツールはあるのか?また分析するツールは提供されているのか?
A:サーチに関しては間もなく新しいツールが出る。LLMに対応する。
Q:研究機関をまたいで使いたい場合、どういう使い方になるのか、気を付ける点などあれば教えてほしい。
A:.elnの交換フォーマットがあるため、データはフォーマットが異なっていても大学間や企業間でデータの参照はできる。ただ、導入時のユーザーのトレーニングが重要となる。また、どのように使っていくかという運用方法を話し合うことが重要である。
Q:機械学習や数学を使うときに、いろいろなツールがある。それらを統合して使うことはできるか?
A:使えるといいたい。実際に数学に用いている人もいる。APIを使うと可能である。特定のソフトに限定されず、APIを通じて柔軟に対応できる。
コメント:大学なので資金が続くか不安がある。資金があるときはホスティングができる。現在学内でミラーリングするシステムを構築中。オープンソースなのでそのようなことが可能。資金がなくなっても、イントラで使い続けることができる。大学レベル、研究室レベル、個人レベルで運用を続けることができる。これが選定基準の一つであった。
Q:一つのホストでどれくらいのユーザーがつかっているのか?
A:5人から5000人。大きなところでは一つのホストで数千のユーザーがいる。大学では500から1000くらい。大学によってはそれぞれの学部や専攻ごとに設定しておいて、場合によってはそれらを統合して使う。

「電子ラボノートを用いた研究活用」(NAIST 高須賀聖五助教)

概要
研究DXにおける電子ラボノートの位置づけはフィジカル(実験)とサイバー(解析)の架け橋である。実験値をDXに活用するにはデータベース化を想定した電子ラボノートの導入・運用が不可欠で、データが個人帰属から離れ、共有利用が可能になることでデータ駆動型科学が有効的に機能する。どの段階の実験データであっても、一元管理できる環境が必要。多様な実験でFAIR(Findable, Accessible, Interoperable, Reusable)データの蓄積が可能なプラットフォームの確立を目指している。電子ラボノートの導入に向けた取り組みとして、6つのアクションをおこした。(1)電子ラボノートの選定。実験科学者とデータサイエンティストの双方にとって使いやすいものを選んだ。(2)定期的な打ち合わせによる議題の洗い出し。二週間に一回のペースで行った。現在はチャットツール並行している。(3)個別説明会の実施。各研究室のニーズに合わせ、詳細を説明した。(4)垣根を超えた運用体制。部署及び研究室が連携しあい、電子ラボノートの運用環境を構築した。(5)学内講習会の実施。(6)チュートリアルの作成。まとめると、人材、意思、環境、様々な要素がそろったときに文化が少しずつ変化する。ツールの活用には用意するだけでなくサポートが必要である。

質疑応答
Q:データ駆動を意識している人は導入の必要性をわかっているが、入力者や測定者にその価値をわかってもらうには?
A:触ってもらって、ハードルを下げる。触るまでのハードルを下げる。のちのち、自分でデータを探しやすくなるし、共有が簡単なところを実感してもらう。
Q:プログラムのメンテナンスの人がいつまでもいるわけではないが、その対策は?。
A:人がいなくなってもよいようにチュートリアルを作成している。
Q:生データの取り扱いは?
A:軽いデータはラボノートヘ。重たいデータは共有サーバに入れてパスを記す。
Q:電子ラボノートや保存先がクラウドで連携できないと使い勝手が悪いのか?
A:連携できると力を発揮できると考えている。
Q:フリーフォーマットで実験ごとに表の項目が変わる。これを構造化するにはどうやっているのか。
A:テンプレートを活用している。テンプレートごとに処理を変えるなどしている。
Q:導入にあたって、前向きな人の割合は?
A:前向きの人は多かった。やりたい人がはじめて、気になる人が加わったという形で広まった。

「NAISTにおける電子ラボノートの活用事例」(NAIST 赤瀬善太郎特任准教授)

概要
電子ラボノートはチームメンバー間で情報共有と情報の検索が行いやすいシステムである。そのインターフェースは所謂ブログに似ているため、一旦使い始めると操作方法に戸惑うことはほぼない。編集不可にするためのブロックチェーンタイムスタンプ機能など、研究記録としての証拠性を担保する機能も備えており、ラボノートとしての信頼性も確保されている。スクリプトやAPIを活用すると入力方法や参照方法を自動化できる。自由度が高いシステムであるため、各研究室で独自の使い方がされている。講演ではNAISTの5研究室の使用実例について紹介した。(1)ラボ内で実験データの一元管理を行うことでラボ内での議論がスムーズに行えるようになった例。その時の導入の工夫。(2)実験ノート記事をURLで共有し、複数人で編集して、一つのノートを書き上げる(一つの実験を遂行する)手順。その際、タブレットのカメラやバーコード読み取り機等のツールの活用例。(3)ドライラボにおいて、日報、ノウハウ共有、プログラムのバグ報告、ワークステーションの予約管理に利用している例。(4)情報系の研究室にてAPIを用いてJupyter notebookの自動バックアップツールを開発した例。(5)実験機器から得られた生データとメタファイルから実験ログをスクリプトで自動生成する例。

「ARIMデータ共用事業の現在と将来展望」(NIMS ARIMセンターハブ長 松波成行様)

概要
ARIM(マテリアル先端リサーチインフラ事業)は、産学官でマテリアルデータを効率的・継続的に創出・共有する仕組みである。MDPF(データ基盤整備)とDxMT(データ利活用)と連携し、「マテリアルDXプラットフォーム」を構成している。ARIMにおけるデータの登録法として、共用機器から得られるマテリアルデータをワンストップでAI活用可能なデータセット化するデータ構造化システム「RDE」を整備している。各装置から得られる生データは様々な拡張子をもつ独自形式のファイルであるが、これを共通したデータ形式、メタデータにそろえて蓄積し構造化する「データアライアンス」を実現している。これにより質の高い観測データが教師データ(学習データ)として活用できるようになっている。また、蓄積されたデータは、ファイルを開かずともその詳細をウェブ上で確認できるデータビュー機能を持たせている。データ共用事業は来年度からスタートするが、構造化されたデータをデータポータルよりライセンス提供する予定。データカタログを整備し、要件を満たしていればDOIを付与する。将来展望に関しては、LLMによるAIアシスタント機能の基礎検討に着手している。個人見解だが、労働者人口の推移をみると将来的に測定機器のオペレーション・メンテナンスは現行の運用では通用しなくなると考えており、知のライブラリー化を図り、高度技術の伝承や共有によるデータ駆動研究の基盤強化を図るべきと考えている。データインフラの省人化およびデータ連携の仕組みを整備し、その強靭化を図りたい。

質疑応答
Q:DOI発行に関してデータの永続性が問題となるが、どのような対策がされているか?
A:NIMSが管理維持を行う。
Q:人口減少に関する問題への対策など地方では何をすればよいか?
A:産業が大事。一方でデータで産業を下支えし、産業と一体になる仕組み社会インフラ作りが必要となってくる。
Q:ARIMの登録者数4000人という数字はARIM利用者全体の人数に対してどれくらい?
A:6~8割の利用者がデータ登録があり。アカデミアでは登録率は高い。
Q:過去に共用されたデータが役に立ったという事例はあるか?
A:現在はデータを登録している段階で、共用はこれから行う。

「画像認識を用いた科学実験の認識と記録」(早稲田大学 次席研究員 藤波美起登様)

概要
AIとDXの進展により、インフォマティクスは理論・計算・実験化学にも応用されている。従来の紙の実験記録はデータ解析との接続に障壁があり、属人的・不規則な記録は不整合を生む。規格化が困難な中、自動記録が有効な解決策と考えた。そこで、「人手の実験でも自動で記録される」状況を目指し、化学実験の自動記録システム構築の研究を行っている。それを実現するために、実験記録動画から作業内容のフローチャートを自動生成するというアプローチをとった。動画から実験内容を抽出するために、「物体検出」「物体追跡」「行動認識」の画像認識技術を活用した。実際の実験の様子を多数記録して、学習用の専用データセットを構築し・学習にもちいた。また、webブラウザで動作するアプリケーション化も行った。現在はセンサー連携によるマルチモーダル化を進め、電子ラボノートへの自動記録を目指している。

質疑応答
Q:人の実験をロボットに真似させることは可能か。
A:そうさせたい。
Q:音声認識と組み合わせると、処理は簡単になると思うがどうか?
A:コンセプトとして、人間が思っていること以上のことを記録していくことを目指している。
Q:装置から得られる動的な情報をその都度取得したいと考えているが、そういうことはされているか?
A:今はしていないが、可能である。
Q:行動認識の学習に3D ResNet34を用いた理由は?
A:当時gitHubが整備されていて、導入が簡単だったため採用した。
Q:ドラフトの音がうるさくて声が取得できないということはあるか。
A:ピンマイクを用いると認識できた。

パネルディスカッション「セッション1:データ管理と共用の課題と現状」
(パネラー:藤井幹也教授、Nicolas Carpi様、松波成行様、藤波美起登様、司会:NAIST 冨谷茂隆教授)

テーマ:電子ラボノートの利点と課題 – データ共用の障壁と解決策
藤井氏より、ELNは単に記録をデジタル化するだけでなく、チーム内での情報共有や実験状況の可視化に有効であると報告された。検索やコメント機能、URLによる共有が可能であり、チャットツールと組み合わせることで研究活動の効率化が実現されている。松波氏は、ファイル形式の多様性(例:拡張子200種)がデータ利用の障壁となっていることを指摘。特に第3者にとっては取り扱いが困難であり、研究データ管理の標準化は国際的な課題であると述べた。Carpi氏は、ヨーロッパの大学で設置が進む「リサーチマネジメントボード」の動きを紹介し、テラバイト級の大容量生データの記録と活用が新たな課題であると指摘した。また、冨谷氏からは大容量データの移動によるネットワーク負荷についての懸念が示され、藤井氏はファイルサーバーの拡充やアクセス権管理(シングルサインオンなど)の重要性を述べた。松波氏は、ARIMにおいて現在大容量データを出力する機器は限られているが、今後の拡大を見据え、データレークとデータウェアハウスの役割分担を明確にする必要があると述べた。ネットワーク負荷については、技術革新を待つか、運用面で対応するか検討中とのことである。Carpi氏は、蓄積されたデータが活用されずに終わるケースも多いとし、「無駄なデータを蓄積しすぎないこと」も持続的なデータ活用の視点から重要であると指摘した。

パネルディスカッション「セッション2:実験現場での活用と技術的課題」

テーマ:実験・計測データの収集と電子ラボノートの活用、AI・画像認識技術との連携可能性
藤波氏は、複数の研究者からデータを集約する際、登録後に専門の担当者がキュレーションを行っており、その人的コストが課題となっていることを指摘。また、画像認識技術は予想外の場面で有用であり、他分野への波及効果も期待できると述べた。失敗と思われた実験でも有用な情報が含まれている可能性がある点も強調された。冨谷氏が「無駄なデータが実は有用となるケース」について言及し、Carpi氏は、無意味なデータとネガティブデータは区別すべきであり、ネガティブデータには他者にとって価値がある場合があると応答。さらに、通信環境の制限下で一時的にデータを蓄積し、接続可能なタイミングで同期する仕組みの紹介もあった。松波氏は、ARIMでは失敗データや期待外れのデータも積極的に登録することを推奨しており、その意義について議論が進められていると述べた。冨谷氏より、実験データの構造化が困難であるとの課題が提起された。これに対し松波氏は、ARIMではAIを直接構造化に用いてはいないが、構造化されたデータはAI活用に適しており、またメタデータの記録を通じて技術者のスキルアップや実験支援にも貢献していると説明。一方で、LLM(大規模言語モデル)の活用についての可能性も挙げられ、藤井氏は、LLMを用いることで構造化そのものをAIで自動的に行うことも可能になってきていると述べた。

パネルディスカッション「セッション3:電子ラボノートの将来展望とデータプラットフォームとの連携」

テーマ:欧州での方向性、産業界・他機関とのデータ共有のあり方
Carpi氏は、現在の研究データの多くが大学内のデータリポジトリにとどまっている現状を指摘。その上で、電子ラボノートを介して外部の機関と接続し、より広範なデータ連携を実現することが今後の目標であると述べた。冨谷氏からの問いかけに対し、Carpi氏は、電子ラボノートの利用には分野間でばらつきがあり、化学、材料科学、生物学では導入が進んでいる一方で、心理学など人文・社会系分野ではあまり使われていないと説明した。また、多くの企業が電子ラボノートに関心を寄せており、特許や知財保護の観点から、記録内容が証拠として活用可能である点に価値を見出していると述べた。藤井氏は、電子ラボノートと大規模言語モデル(LLM)との連携に大きな可能性を感じており、記録された情報をチームでLLMに統合できれば、有用なアドバイザーとして活用できると提案した。また、データ提供者に対するインセンティブの設計や、秘匿性を保ちつつデータを共有する技術(例:コピーされないラッピング技術)の重要性を指摘。データを「供出して終わり」にしない仕組みづくりが今後の鍵となると述べた。セッションのまとめとして冨谷氏は、さまざまな活用事例や今後の可能性が示された一方で、依然として多くの課題が残されているとし、参加者からのフィードバックや継続的な議論の必要性を強調した。

アンケート結果

本フォーラム終了後に実施した参加者アンケートでは、多くの方から貴重なご意見・ご感想を頂きました。下記のリンクより、アンケート結果をご参照頂けます。これらのフィードバックを真摯に受け止め、今後もフォーラムを継続的に開催し、より実践的で有益な情報交換の場を提供していきたいと考えています。

パネルディスカッションの様子

お問い合わせ:
ご質問やご不明な点がございましたら、下記までお問い合わせください。
※内容によってはご返信までにお時間をいただく場合がございます。あらかじめご了承ください。

赤瀬 善太郎(NAIST DSC RX実装部門 特任准教授)
E-mail: dsc-info(at)dsc.naist.jp(事務局)