【長期インターン】本日の業務・AIプロンプトにおける出力の体系的な評価基準
こんにちは、株式会社ガーディアン京都開発研究所所属WEBプログラマーコース長期インターン生の畑尚吾です。
本日の業務もOWLの仕様変更を進めておりました。その中で、作成していたプログラムが思惑通りの動作がせずに、色々コードを書き換えたり、調べたりしていました。ハイブリット型のParserの作成で、二つのクラスのいいとこ取りができたらいいと思って作成しました。そうすると、前からの問題としてGithubのReadmeで書かれていたnamespaceの消失問題が解決できませんでした。結果としては、サンドパーティを用いて作成を試みることにし、また作成し直しかなと思っております。
ここまで、できると信じて作成していたものが、ダメになる絶望感を感じながらも、これまでのものを活かしてより早く作成ができるようにと頭が切り替えられたのは、成長したのではと感じています。
プロンプトを聞いた時の結果として、少しでも自分自身で評価ができることが必要だと思い、今回のテーマにさせていただきました。
出力の品質に関する基準
生成されたアウトプットそのものの出来栄えを以下の評価基準をもとに評価します。
1. 忠実性
指示した役割やトーン形式をしっかりと守っているのか?
2. 正確性
生成された情報に事実誤認がないか?
3. 完全性
要求した要素が全て出力に含まれているか?
4. 一貫性
出力全体で論理的な矛盾はないか?
5. 有用性
ただ正しく出力されただけでなく、最終的な目的に対して、本当に役立つ内容になっているか?
6. 可読性
生成された文章やコードが、人間にわかりやすく、読みやすいか?
7. 安全性
論理的に問題のある表現、個人情報などの不適切な情報を含んでいないか?
出力の基本的な評価基準としては、この7つになります。
この評価基準は、自分が何か文章を書いたときにも使える評価基準になると思うので、この評価基準をもとにAIプロンプトを作成してみて、AIに評価を出力してもらうのもとても参考になって良いと思います。また、入力の評価基準もあったりするので、後々書こうと思います。
メンバー紹介:https://guardian.jpn.com/member/
長期インターン生の活動日記:https://guardian.jpn.com/intern/
*コメント*
NEW
-
date_range 2026/02/13
-
date_range 2026/02/13
【長期インターン】プラ...
-
date_range 2026/02/13
【長期インターン】大学...
-
date_range 2026/02/10
【長期インターン】大学...
-
date_range 2026/02/10
【長期インターン】API...
*COMMENT*
高橋 かほ
*コメント*
お疲れ様です!とても難しそうな、でも完成したらとても役立ちそうなことをされていて、すごいなぁといつも拝見しています^^
私もAIにコーディングしてもらうことがあります。恐らく私の投げるプロンプトが良くないのだと思いますが、なかなかうまく修正できなくてモヤモヤすることがあるので、入力の評価基準も気になります!
*コメント*
下川 春樹
*コメント*
お疲れ様です。
なんだかとても難しい事をされていますね、一度読んだだけでは上の方の内容が分かりませんでした。。。
今日初めてAIに、パーツの枠を作ってもらいましたが、以外とうまくいきました。やったこととしては、作りたいパーツのスクショを送って、コーディングしてとプロンプトを投げる。結構、見た目が再現されておりすげーなと思いましたが、HTML側はOWLetのコードに書き換えないといけませんので、1からコード書くよりかはちょっと早くなったかなという感じでした。
OWLetの記述化までスパンとできれば、工数爆下がりなので、色々試していきたいと思います!
*コメント*
河原田 ゆきえ
*コメント*
夏休みの課題テーマ決めてスガショーと一緒に取り組んで、チーム開発やってみるとかどう🥰?
*コメント*
熊谷 ゆか
*コメント*
「できるはず!」と割と自信を持っていたことが上手くいかないと絶望する気持ちが分かりすぎます…(笑)
色々な場面でありますよね💦
「でも答えは必ずあるはず!」と気持ちを切り替えて取り組んでいます。
少しずついいものになるといいですね✨
*コメント*