⚠ ネタバレ注意: 本サイトはSFアニメ「SOLAR LINE」の内容を詳細に分析しています。未視聴の方はご注意ください。
📝 AI生成コンテンツ: 本考証の大部分は AI(Claude Code 等)によって生成されています。内容の正確性については原作および引用元をご確認ください。

Task 289: Video OCR pipeline

完了 ← タスク一覧

Task 289: Video OCR pipeline

Status: DONE

Description

Build a video OCR extraction pipeline using Tesseract to extract subtitle text and HUD/instrument panel text from video frames. This creates a new transcription data source alongside VTT and Whisper.

Approach

  1. Subtitle extraction: Grayscale threshold (>180) on bottom 20% of frame → Tesseract jpn
  2. HUD extraction: Lower threshold (>120) on upper 70% of frame → Tesseract eng
  3. Process all episodes using existing extracted keyframes

Results

Technical Details

Files

Follow-up