【Python/VLM/フルリモート】ドキュメント構造化R&Dエンジニア（Visual RAG）

報酬

〜975,600円/月

職種

AIエンジニア

場所

港区（東京都）

雇用形態

業務委託(フリーランス)

業務内容

【作業内容】 VLM等の最新技術を活用し、ドキュメント構造化の信頼性や機能を向上させるための研究開発および検証をリードいただきます。単なるPoCにとどまらず、実運用を見据えた「使える技術」への昇華を担っていただきます。 VLMを活用したドキュメント構造化パイプラインの構築・改善を行っていただきます。プロンプトチューニングなどによるVLM出力精度の向上と、バリデーション機能の開発を行っていただきます。図面解析など、顧客課題に応じたPoCの技術検証・実施を行っていただきます。【チーム構成】事業責任者1名、開発責任者1名、プロダクトエンジニア7名、RAGエンジニア5名、機械学習エンジニア3名、プロダクトマネージャー1名、リサーチャー1名、CS1名、Biz3名、新規事業企画5名で構成されています。【ポジションの魅力】 VLM/マルチモーダルAIという最先端技術を、実験室レベルではなく実運用に乗せるための環境整備・開発ができるポジションです。図表特化のRAGなど、市場でもまだ確立されていないソリューションの開発に携わることができます。 PoC対応だけでなく、モデルの運用改善やパイプライン構築など、技術的な深掘りができるテーマがあります。【開発環境】使用言語・フレームワークとしてPython、TypeScript、Vue.js、Node.jsを利用しています。コンテナとしてDockerを利用しています。 IaCとしてTerraformを利用しています。クラウドとしてAWSとAzureを利用しています。

スキルタグ

PythonVue.jsAWS

求めるスキル

■必須スキル：: ・理工系大学院を修了していること・LLMまたはVLMを活用したアプリケーション開発、またはPoCの実施経験・Pythonを用いたR&Dまたはサービス開発経験・RAG（Retrieval-Augmented Generation）の基本的な仕組みの理解・未知の技術領域（特にマルチモーダルモデル）に対する調査・検証能力

■歓迎スキル：: ・画像処理・Computer Visionに関する知識（OCR、レイアウト解析、物体検出等）・複数のVLMモデルの比較検証やパイプライン構成の経験・論文調査（ArXiv等）を行い、実装に落とし込める能力・顧客課題を技術課題に翻訳し、解決策を提案した経験

特徴

リモート可週5勤務

更新日: 18時間前