2021年に注目されるデータ分析関連ベンチャー【B2B編】

ビジネスモデル解説

※当サイトではアフィリエイト広告を利用しています。

2020年は、コロナ禍によって紙やFAXに基づいた業務があまりに多いことが認識され、データ分析を普及させるには、まず、デジタル化を促進する必要があることが指摘されました。2021年は、社会のデジタル化を促進し、人工知能の開発・適用を後押しする技術に注目が集まるものと考えられます。

幻滅期にある人工知能で、特化型のデータ分析企業が生き残る

ガートナー社は、2019年のテクノロジー・ハイプサイクルにおいて、人工知能(AI)やモノのインターネット(IoT)が「幻滅期」に入ったと分類しました。市場に登場した新技術が、期待に見合わないまま過熱気味にもてはやされる「過度な期待のピーク期」を越え、幻滅されるようになったことを意味します。

同社のハイプサイクル・モデルによると、これから、市場への浸透が進む「啓蒙活動期」そして、成熟した技術として市場に受け入れられる「生産性の安定期」へと続きます。

幻滅されたトピックとしては、人工知能が人間の知性を越えるシンギュラリティ、特定の課題ではなく何でも対応できる汎用AIといったものがあるのではないでしょうか。実際に導入された人工知能プロジェクトは、特定のデータ分析において、人間では解析しきれない分量の情報を解析したり、これまでにはない洞察を得たりするのが現実的です。

人工知能やデータ分析に関連し、2020年に注目されたベンチャー企業としては、パランティアが代表的です。ピーター・ティールが創業したデータ分析企業で、国防や諜報活動といった分野に強みを持つ企業として知られています。近年は他の業界にもビッグデータ分析技術を提供するようになり、日本ではSOMPOホールディングスやヤマトホールディングスとの提携が発表されました。2020年にIPOを果たし、今後の成長が期待されています。

人工知能プロジェクトにおいて、収集と前処理にかかる大きな負担

人工知能プロジェクトを実施する上では、複数のステップによって実現されます。具体的に含まれるのは、データの収集、データの前処理、モデル構築、モデル評価、導入、改善といった手順です。多くの人は、モデル構築・評価といった箇所に注目が集まりますが、現実のデータを扱う上では、データの収集・前処理に大きな負担がかかります。

データ収集の段階では、分析に使える精度の高い情報が必要です。コロナ禍において紙やFAXを用いた業務プロセスに批判が集まりましたが、このように業務ではデータ化ができておらず、データ分析に使えません。構造化されたデータとして取得する必要があります。

また、機械学習を行う上では「ラベリング」が課題となります。例えば、新型コロナの診断支援を行うためにCT画像を分析するプロジェクトでは、新型コロナにかかった患者のデータと、そうでない人のデータをラベル付けしなければなりません。このラベル付けは、診断のできる医師の助けが必要です。同様に、「教師あり学習」を行うプロジェクトでは、その業界に特化した知識が求められるケースが多いのです。

データ・サイエンティストの仕事では、データの前処理に8割の時間がかかるとさえ言われいます。ラベリングにミスがあったり、データが抜けていたりして、品質の低いデータでは、データ分析の精度が上がりません。データの補完・修正・削除を行うデータクレンジングにより、欠損・表記揺れ・外れ値処理といった問題を解決し、データの品質を担保します。

このようなデータの収集・前処理にかかる負荷が想定以上に要する点も、人工知能に関する幻滅を招いたのかもしれません。この最も手のかかる手順にこそ、自動化や最適化の余地があり、新たなソリューションが求められています。

2021年に求められるデータ・ラベル付けソリューション

2021年で注目されるベンチャー企業として、データのラベル付けを行う企業を上げたいと思います。機械学習においてモデル構築・評価に強みを持つ企業は、その前処理に関する負担を下げたいと考えています。そこで、ラベル付けを支援するソリューションが求められるからです。コンピュータビジョンを用いて自動的にラベル付けを行う場合と、専門チームをオフショアに配置し安価で手動のラベル付けを行う二つの手法が考えられます。

例えば、Labelboxは輸送・農業・医療・保険・航空・製造・建設といった様々な業界で、機械学習の訓練データを用意する前処理工程を支援するプラットフォームを提供しています。2018年に創業された同社は、2020年2月にシリーズBとして2500万ドルの資金を調達しました。

その他にもScale.ai等、データの前処理を支援するベンチャー企業は増加してきています。Grand view research社の調査では、データの収集・ラベリングの市場規模は、2019年の10億ドルから、年率26%で成長するという予測がなされています。

2021年に求められる業界特化型データ分析ソリューション

汎用AIではなく特化型AIが研究開発されている現状を考えると、人工知能プロジェクトを推進するには業界知識が求められています。前述のデータ・ラベリングでも明らかなように、データの品質を保証したり、モデルの評価を行ったりするには、業界知識に基づいた洞察が必要です。

2020年にIPOしたパランティアが政府向けソリューションから物流や保険へ横展開したように、2021年以降に成長するベンチャー企業も、業界特化型であることが予想されます。既に1億ドル以上を調達した企業の中にも、業界特化型のAI企業が多数含まれています。法令遵守を支援するAscent、医療データを扱うTempus、様々な例が挙げられます。

まとめ

人工知能は2020年代に大きな影響を与える技術ですが、高まり過ぎた期待が幻滅し、実際に、どのように社会を変革できるかを現実的に見定める段階にあります。幻滅した理由として、汎用AIよりも特化型AIが現実的なこと、あるいは、モデル構築よりも収集・前処理に負荷が高い点が指摘されました。2021年以降に期待されるのは、データの収集・前処理を支援するソリューションによって人工知能プロジェクトを促進し、特化型AIが社会に普及することではないでしょうか。

タイトルとURLをコピーしました