Yyatmita

yatmita テックラボ

やってみた の裏側。サイト構築、ナレッジ管理、AIツール活用の実験記録

シリーズ

最新の記事

【第30回】Grok Imagine API を漫画コマ生成に使ってみた——OpenAI 互換のフリして全然違う、料金・3枚制限・棲み分け

xAI の Grok Imagine API(grok-imagine-image / grok-imagine-image-quality)を manginus に組み込んだ記録。OpenAI 互換と謳いつつ size パラメータが NG、edits は multipart ではなく JSON、参照画像は3枚まで——ハマりどころを全部書く

AIマンガ制作ワークフロー

ファクトチェックを3段に畳む——320件の主張と143本の出典を、ひとつのコンテキストに入れずに裏取りする

解説マンガ1話ぶんの主張325件と出典143本を、ひとつのコンテキストに入れずに裏取りした。原稿を部ごとに切り出して「主張のリスト」に畳む、リストを「検証チェックリスト」に畳む、最後にリンクの実在と内容の直接関連性を別パスで検査して「報告」に畳む。3段の fan-out で巨大コンテキストを段ごとに圧縮する subagent パイプラインの組み方を、修正の確定権は人間に残すという境界線と一緒に書いた。

自分のエージェント基盤を組む

Claude Code の deep-research を解剖する — エージェント基盤に持ち帰る7つの設計判断

Claude Code 組み込みの deep-research スキルは、5フェーズの Workflow script として実装されている。中を開くと、フェーズ境界に Schema を置く・Pipeline を default にする・敵対的検証で棄権を「失敗」として扱うなど、汎用エージェント基盤に丸ごと転用できる設計判断が並んでいた。100 近いエージェント呼び出しが走る deep-research のソースを節ごとに開き、抽出できる7原則をまとめる。

自分のエージェント基盤を組む

ルールブックをWorkflowに食わせて、決定論的なlintを生成する——LLM校正の確率性を2レイヤーで畳む

あるドメインのルールブックをdynamic workflowに食わせて構造化し、それをregex lint + LLM verifierの2レイヤーに落とす。LLM一発校正で200万トークン・毎回違う指摘という確率的な状態から、56倍トークン削減・10倍高速・候補集合は完全決定論まで持っていった途中経過。ground truth pytestで正当性を客観保証するメカニズムも含めて、設計の判断と失敗を時系列で記録する。

自分のエージェント基盤を組む

ファクトチェックの典型手順と、工程ごとのエージェントの使い分け——事実320件の裏取りから(セッション編)

ファクトチェックは決まった工程を踏む——主張の抽出・優先度付け・証拠収集・照合判定・訂正・出典の実在チェック・合成。工程ごとに向いているエージェントの使い方は違う。並列ツール/サブエージェント(深掘り・多視点verify)/決定論スクリプトをどこに置くか、解説マンガ1話ぶんの事実320件の裏取りを通して工程ごとに地図にした。

自分のエージェント基盤を組む