沿革
Rokid Technology
多次元視覚アルゴリズムモデル
ARポジショニングと機能強化
センチメートル・レベルの視覚マップを構築できる業界トップクラスの視覚ポジショニング機能とサービス現実世界にバーチャル情報を正確にマッピング可能物体やシーンの高精度な3次元再構築を実現
デジタル・ヒューマン・テクノロジー
デジタルヒューマンエンジンを自社開発し、顔のピンチングや衣装のカスタマイズに対応可能SDKを統合することで、サードパーティの開発者がデジタル・ヒューマン・エンジンのサービスにアクセス可能2D画像から復元度の高い3D画像を生成するAI顔のピンチング技術をサポート
ジェスチャー認識
2D/3Dジェスチャーのサポート水平/空間軸回転、明暗、その他複雑なシーン認識をサポート様々な種類のジェスチャー、精密なアルゴリズム、90%以上の総合認識率ミリ秒レベルの認識応答能力と99.9%の信頼性保証
AIアプリケーションのアルゴリズム
顔、ナンバープレート、計器、OCR、その他の知覚認識アルゴリズムグラフィックス超分割およびグラフィックス回復アルゴリズムによる視覚体験の向上高精度で迅速な商品化が可能
多次元視覚アルゴリズムモデル
1/4
完全型AI音声サービス
音声読み上げ機能
トーンを幅広いスタイルでカスタマイズ可能
男性、女性、子供など様々なボイスを収録
プライベートな場面での導入をサポート
男性、女性、子供など様々なボイスを収録
プライベートな場面での導入をサポート
音声起動ソリューション
起動成功率99%以上
二音節による起動
高速で高い起動率
二音節による起動
高速で高い起動率
6DoF空間音響フィールド
没入感のある空間音響テクノロジー
バーチャルと現実の混合を実現
独自の空洞型構造デザイン
自社開発の効果音アルゴリズムで音質向上
バーチャルと現実の混合を実現
独自の空洞型構造デザイン
自社開発の効果音アルゴリズムで音質向上
音声認識
高精度、低遅延のASRサービス
スピーカー認識、音源分離テクノロジー
様々な分野の一般化利用
スピーカー認識、音源分離テクノロジー
様々な分野の一般化利用
声紋認識
迅速な登録と認証
認識率96%以上
ノイズ、残響、複数のスピーカー使用などの複雑な場面で導入可能
認識率96%以上
ノイズ、残響、複数のスピーカー使用などの複雑な場面で導入可能
マイク配列
従来の音響ノイズ除去を含む音響処理アルゴリズムを提供
AIノイズリダクション、残響除去
オートゲインコントロールとその他の音響処理アルゴリズム
AIノイズリダクション、残響除去
オートゲインコントロールとその他の音響処理アルゴリズム
完全型AI音声サービス
音声読み上げ機能
トーンを幅広いスタイルでカスタマイズ可能
男性、女性、子供など様々なボイスを収録
プライベートな場面での導入をサポート
男性、女性、子供など様々なボイスを収録
プライベートな場面での導入をサポート
音声起動ソリューション
起動成功率99%以上
二音節による起動
高速で高い起動率
二音節による起動
高速で高い起動率
1/4