講師の活動を知る
- ※新本News※ 2月19日発売! 名古屋大学工学研究科 准教授 藤原幸一先生
- 【スモールなデータの解析手法・ノウハウが身につく!】
Webデータや画像データに代表されるようなビッグデータが注目される一方で、機械の故障データのように発生自体がまれであったり、患者さんの検査データのように倫理的な問題からデータを集めることに制約があったり、あるいはデータの判読が専門家以外では困難で機械学習に利用しにくいデータは、どうしても忘れられがちです。ビッグデータの時代において、収集が難しいために私たちが忘れかけているデータのことをスモールデータとよびます。
スモールデータでは、測定されている変数の数に比べて学習に必要なサンプルが不足していたり、それぞれのクラスのサンプル数が極端に偏っていたりするため、深層学習のようなビッグデータの方法をそのまま適用するのは適当ではなく、異なるアプローチが必要になります。
本書は、スモールデータとはどのようなデータであるのかを具体的に紹介して、スモールデータ解析の基本となる次元削減と回帰分析を説明します。特に部分的最小二乗法(PLS)はスモールデータ解析の大きな武器となるでしょう。そして、機械学習においてモデルの性能向上のために必要な変数(特徴)選択を紹介し、特にクラスタリングに基づいた新しい変数選択手法を説明します。つづいて、不均衡なデータの解析手法と異常検知を紹介して、最後にスモールデータ解析についての筆者の経験に基づいたポイント・考え方を述べました。本書ではPythonプログラムとスモールデータ解析の例題を通じて、読者がスモールデータを有効に解析できるようになるよう工夫しています。
ビッグデータの世界は、もはやデータ量と資本力が支配するレッドオーシャンとなっています。しかし、スモールデータの世界は、まだまだ現場の創意工夫次第でデータから新たな価値を引き出すことのできるブルーオーシャンなのです。みなさんも、この未知の世界に飛び込んでみませんか?
【このような方にお勧め】
◎製造ラインや医療現場などでデータの解析を行う技術者、研究者
○データサイエンス系の技術者、研究者、学生
- 名古屋大学工学研究科 准教授 藤原幸一先生 講義日 2021.08.12
- 安全な交通社会の実現のためには,どのような仕組みがあれば安全運転を実現できるかについて考える必要があります.そのためには,車両や道路,信号システムなどのハードウェアだけではなく,ドライバにも着目しなければなりません.そのため,安全運転については機械や土木などの工学分野のみならず,心理学や医学など幅広い分野での取り組みが求められています. ドライバについての調査では,運転中の行動を測定することがあります.しかし,実車環境,特に公道では安全面の懸念があるため,実験の実施は困難となります.そのような場合に活用されるのが,仮想環境において自動車運転を模擬できるドライビングシミュレータ(DS)です. DSは一般に,車両挙動を模擬するコンピュータと,インストゥルメンタルパネルやステア,アクセルペダルなど運転席を模擬したコクピット,コクピットの前面や側面に運転席内からの車外の風景を投影するディスプレイまたはプロジェクタスクリーンとスピーカーから構成されています.ドライバの入力するステアやアクセル操作と路面状況に基づいてリアルタイムに車両挙動をシミュレートして,車外風景やエンジン音などを生成し,運転環境をできるだけリアルに再現するのです.また,DSによっては,エンジンや路面からの振動なども再現できものもあります. DSを用いることで,安全に実験が実施できるようになりますが,さらに実車では測定の困難な情報も取得できます.たとえば,運転時のステア角度やアクセル開度を実車から取得するには特殊な装置が必要なのですが,DSではこれらの情報はすべてシミュレーションソフトウェア内部で記録されています.これによって,実車では測定が難しい運転技能についても定量評価できます.また,実車では電磁的環境がよくないため,運転中のドライバ脳波を測定しようとするとアーチファクトしか見えなくなります.しかし,多くのDSは実車ほどノイズが入らないため,運転中の脳波も比較的綺麗に記録できるというメリットもあります. 現在,名古屋大学の医学部と工学部では,疾患をお持ちの患者さんが運転してもよいのかを判断できる仕組みを新たに構築することを試みています.この研究においても運転データの取得にはDSを用いており,取得した運転データから機械学習を用いて運転技能を評価できるアルゴリズムを開発するのです. このように,運転中のドライバの行動とそれに応じた車両挙動の研究のために,ますますDSが活用されるようになるでしょう. 著書 : 次世代医療AI 生体信号を介した人とAIの融合