はじめに:AI進化の隠れた原動力
AIモデルの目覚ましい進化の陰には、膨大な学習データの存在があります。現在、生成AIを巡る「AIゴールドラッシュ」が繰り広げられていますが、その中で最も巨額の利益を上げているのは、意外にもAI学習データを提供する知られざる企業群です。MercorやHandshakeといった企業が驚異的な成長を遂げ、新しい億万長者を生み出しています。
Mercorの驚異的な成長:若き億万長者たちの台頭
19歳のブレンダン・フーディが高校時代の友人たちと立ち上げたMercorは、当初、海外のソフトウェアエンジニアを雇用する人材派遣会社としてスタートしました。2024年初頭には、データラベリング大手Scale AIから1,200人ものエンジニア派遣要請を受けましたが、Scale AIの賃金未払い問題(訴訟中)を背景に、フーディは直接取引へと舵を切りました。その結果、Mercorは年間収益5億ドル、企業価値100億ドルに達し、「史上最速で成長する企業」の一つとなりました。22歳になったフーディとその共同創設者たちは、最年少の自力で富を築いた億万長者となっています。
データ需要の高まりと市場構造の変化
フロンティアAIラボは、すでにアクセスしやすいデータのほとんどを使い果たし、現在はプログラミングや金融といった専門分野の専門家が作成した、より高品質で特注のデータセットに注力しています。投資家や業界関係者の概算では、今年、AI学習データへの支出は100億ドルを超え、その大半がわずか5社程度の企業によるものです。AIラボの多くがまだ収益化に苦戦する中、これらのデータ提供企業はすでに黒字を達成しており、まさに「AIのつるはしとシャベル」を売るビジネスとして成功を収めています。
データ産業の変遷:メカニカル・タークからRLHFへ
データ産業は長らく、AI開発における「裏方」として過小評価されてきました。初期の機械学習を支えたのは、Amazon Mechanical Turkのようなクラウドソーシングプラットフォームであり、画像ラベリングなどに利用されました。自動運転技術の発展は、Scale AIのような企業がRemotasksプラットフォームを通じてデータアノテーションを洗練させ、業界を成長させました。
そして、ChatGPTの登場は、RLHF(人間からのフィードバックによる強化学習)の需要を劇的に高めました。これは、人間のレビュアーがチャットボットの応答の質を評価し、AIモデルを訓練するという手法です。この分野では、元データサイエンティストのエドウィン・チェンが設立したSurge AIが急速に台頭しました。Surge AIは、過去のベンダーの低品質なデータに不満を抱いていたチェンの経験から、よりターゲットを絞った人材募集と厳格な品質管理を特徴とし、時給30ドルと高額な報酬を支払うことで専門家を惹きつけました(ただし、Scale AIと同様に未払い賃金で訴訟に直面しています)。Surge AIは昨年の収益が10億ドルを超え、Scale AIの8億7000万ドルを上回り、企業価値150億ドルでの資金調達を検討していると報じられています。
強化学習の限界と「採点基準(Rubric)」の重要性
しかし、RLHFにも課題があります。モデルはしばしば「素晴らしい指摘です」といった表層的な反応を学習し、事実の整合性や複雑な倫理的判断を伴う真の理解には至らないことがあります。モデルは司法試験に合格しても架空の判例を作り出したり、会計士試験に合格してもスプレッドシートで誤ったセルを選択したりします。今年7月のMITの研究では、生成AIを導入した企業の95%が投資回収をゼロと報告しています。
この問題を解決するため、AI企業は「採点基準(Rubric)」に注目しています。これは、弁護士やコンサルタントといった専門家が、特定の業務における「良い仕事」とは何かを詳細に定義するものです。Cohereのジョエル・ピノーは、強化学習が単一の報酬関数に依存する限界を指摘し、複数の相反する価値が共存する状況に対応するには「全く異なるパラダイム」が必要であると述べています。
採点基準の作成は非常に労力を要し、一つの基準を洗練させるのに10時間以上かかることも珍しくありません。OpenAIが医療ベンチマークで公開した例では、反応のない隣人への対応について、「脈拍を確認する」「除細動器を探す」「心肺蘇生を行う」など、16項目もの詳細な基準が設けられています。AIラボは、トレーニングランごとに数千万もの基準を含む、数十万の採点基準を要求しています。この需要に応えるため、「AIジム」と呼ばれる強化学習環境の市場も活況を呈しています。モラベックのパラドックスが示すように、人間にとって簡単なことが機械には最も難しいという逆説が、この複雑なデータ市場の背景にあります。
加速するデータ企業のエコシステムと競争
このデータゴールドラッシュは、新たな企業を続々と生み出し、競争を激化させています。Surge AIはフィールズ賞受賞の数学者や最高裁判所の弁護士を、Mercorはゴールドマンサックスのアナリストやマッキンゼーのコンサルタントを擁していると宣伝しています。Handshake AIは、元々大学生向けの人材サービスでしたが、MetaがScale AIに49%出資したことをきっかけに、ライバル企業がScale AIから離反し、需要が3倍に跳ね上がりました。
この市場には、人材派遣会社からデータラベリングに転換したTuring、アノテーションソフトウェア企業が専門家サービスを開始したLabelbox (Alignerr)、AI訓練企業へと舵を切ったInvisible TechnologiesやPareto、そしてMicro1といった多岐にわたる企業が参入しています。さらには、Uberまでもがデータラベリングのスタートアップを買収し、参入を試みています。Sapienのように暗号通貨でラベラーに報酬を支払うニッチな企業も存在します。これらの企業は、NvidiaがAIチップ市場で「つるはしとシャベル」を売るように、AIのゴールドラッシュを支えるインフラとして、巨額の投資を引き受けています。
しかし、この産業は歴史的に不安定でもあります。かつての巨人Appen社の事例が示すように、トレーニング技術の変化や主要顧客の離反によって、短期間で市場価値を失うリスクも孕んでいます。現在の市場も顧客集中度が高い傾向にあり、今後の生存競争は熾烈を極めるでしょう。
元記事: https://www.theverge.com/cs/features/831818/ai-mercor-handshake-scale-surge-staffing-companies
