リモート可

【Python/TypeScript/フルリモート】AI R&Dエンジニア(VLM・マルチモーダル)募集

報酬
1,080,000円/月
場所
東京都
雇用形態
業務委託(フリーランス)
業務内容
【募集背景】 自社プロダクトの製造業向けAIエージェント(SaaS)、業務AI実装支援プラットフォーム(PaaS)の導入、運営をしている企業において、エンタープライズ向けのPoCプロジェクトが増加する中、テキスト情報だけでなく図面、図表を含むドキュメントの活用ニーズ(Visual RAG)が急増していることや、VLM(Vision-Language Model)の活用において精度・コスト・速度・信頼性の面で多くの課題があること、VLMを活用したドキュメント構造化のPoC実施から安定した機能としてプロダクトに組み込むための運用改善、パイプライン構築を担うR&Dリソースを強化したいことから、AI R&Dエンジニア(VLM・マルチモーダル)を募集しております。 【作業内容】 ・VLM等の最新技術を活用し、ドキュメント構造化の信頼性や機能を向上させるための研究開発および検証をリードしていただきます。 ・単なるPoCにとどまらず、実運用を見据えた使える技術への昇華を担っていただきます。 ・VLMを活用したドキュメント構造化パイプラインの構築・改善を行っていただきます。 ・プロンプトチューニングなどによるVLM出力精度の向上と、バリデーション機能の開発を行っていただきます。 ・図面解析など、顧客課題に応じたPoCの技術検証・実施を行っていただきます。 【開発環境】 ・使用言語/フレームワーク:Python、TypeScript、Vue.js、Node.js ・コンテナ:Docker ・IaC:Terraform ・クラウド:AWS、Azure
スキルタグ
求めるスキル
■必須スキル:
・LLMまたはVLMを活用したアプリケーション開発、またはPoCの実施経験 ・Pythonを用いたR&Dまたはサービス開発経験 ・RAG(Retrieval-Augmented Generation)の基本的な仕組みの理解 ・未知の技術領域(特にマルチモーダルモデル)に対する調査、検証能力
■歓迎スキル:
・画像処理、Computer Visionに関する知識(OCR、レイアウト解析、物体検出等) ・複数のVLMモデルの比較検証やパイプライン構成の経験 ・論文調査(ArXiv等)を行い、実装に落とし込める能力 ・顧客課題を技術課題に翻訳し、解決策を提案した経験 ・理工系大学院を修了