取引所DEX+

実証研究と再現実験により、開発者はテストとコードレビュー技術の有効性を頻繁に誤認識していることが明らかになりました。これらの誤った判断は多くの場合実証研究と再現実験により、開発者はテストとコードレビュー技術の有効性を頻繁に誤認識していることが明らかになりました。これらの誤った判断は多くの場合

なぜ開発者は間違ったテスト技術を選び続けるのか

著者：Hackernoon

出典：Hackernoon

2025/12/15 05:09

WHY$0.00000001529--%

:::info 著者:

Sira Vegas
Patricia Riofr´ıo
Esperanza Marcos
Natalia Juristo

:::

リンク一覧

要約

1 はじめに

2 オリジナル研究：研究課題と方法論

3 オリジナル研究：妥当性の脅威

4 オリジナル研究：結果

5 複製研究：研究課題と方法論

6 複製研究：妥当性の脅威

7 複製研究：結果

8 考察

9 関連研究

10 結論と参考文献

要約

ソフトウェア開発における繰り返し発生する問題の一つは、使用する技術、方法、ツールに関する誤った意思決定です。これらの決定は主に開発者の認識に基づいています。人々の認識に影響を与える要因の一つは過去の経験ですが、それだけではありません。本研究では、事前経験がない状態で、異なる欠陥検出技術の有効性に対する認識が実際の有効性とどの程度一致するかを明らかにすることを目指しています。

\ これを行うために、実証研究とその複製を実施しました。オリジナル研究では、学生を対象に2つのテスト技術と1つのコードレビュー技術を適用する統制実験を行いました。実験の最後に、どの技術が最も効果的だと認識しているかを調査するためのアンケートを実施しました。結果は、参加者の認識が間違っており、この不一致が品質の面でコストがかかることを示しています。

\ 結果についてさらに洞察を得るために、統制実験を複製し、アンケートを拡張して参加者の技術とプログラムに関する意見についての質問を含めました。複製研究の結果は、オリジナル研究の発見を確認し、参加者の認識は複雑さに関する意見や技術に対する好みではなく、自分が技術をどれだけうまく適用したと思うかに基づいている可能性があることを示唆しています。

1. はじめに

現在、ソフトウェア開発企業が開発者に自分の技術環境を選択させることが、ますます一般的な慣行になっています。これは、異なる開発者が異なる生産性ツール（プログラミング言語、IDEなど）を使用する可能性があることを意味します。しかし、ソフトウェアエンジニアリング（SE）は人間中心の分野であり、誤った決定が結果として生じるソフトウェアの品質を潜在的に損なう可能性があります。SEでは、Dyb˚aら[19]とZelkowitzら[55]が示唆するように、ソフトウェア開発で使用する方法、技術、ツールに関する決定は、通常、証拠ではなく開発者の認識や意見に基づいています。

\ しかし、特定の設定内で、あるいはまったく研究されていない特定の方法、技術、ツールがある可能性があるため、実証的証拠が入手できない場合があります。あるいは、Vegas & Basili [49]によると、開発者がそのような研究に単に精通していない可能性もあります。このため、開発者の認識（信念）が現実とどの程度一致しているか、そして一致していない場合、この不一致の背後にあるものを発見することが重要です。これはDevanbuら[14]によって指摘されています。心理学によると、経験は人々の認識において役割を果たします。これはSEにおいてもDevanbuら[14]によって観察されています。

\ しかし、この研究は、使用されている技術に関する以前の経験がない状態で、認識が現実とどの程度一致しているかを発見することを目的としています。これはいくつかの理由で意味があります：1）経験は開発者の認識に影響を与える唯一の要因ではない；2）開発チームは通常、経験のある人とない人の混合で構成されている；3）どのタイプの経験が認識に影響を与えるかは明確ではない。例えば、Diesteら[17]は、テスト駆動開発を適用する際に開発者が生成するコードの外部品質に影響を与えているのは、専門的な経験ではなく学術的な経験である可能性があると結論付けています。

\ 私たちは、3つの欠陥検出技術の有効性に関する認識が現実と一致するかどうか、そしてそうでない場合、これらの認識の背後にあるものは何かを研究することを目指しています。私たちの知る限り、これはこの問題を実証的に評価する最初の論文です。このために、学生を対象に実証研究とその複製を実施しました。オリジナル研究では、参加者が適用した2つのテスト技術と1つのコードレビュー技術の有効性を（統制実験の一部として）測定しました。その後、（アンケートによって収集された）認識された最も効果的な技術を実際のものと比較しました。

\ さらに、認識と現実の間の不一致のコストを有効性の損失の観点から分析しました。主な発見には以下が含まれます：

– 異なる人々は異なる技術をより効果的だと認識しています。他の技術よりも効果的だと認識されている技術は一つもありません。– 参加者の50％（23人中11人）の認識は間違っています。

– 技術に対する誤った認識は、平均して有効性を31pp（パーセントポイント）低下させる可能性があります。

\ これらの発見により、参加者の認識の背後にあるものを調査するために、複製研究で研究の目標を拡張することになりました。これを行うために、統制実験の複製において、彼らが適用した技術とテストしたプログラムに関する意見を調査しました。主な発見には以下が含まれます：

– 複製研究の結果は、オリジナル研究の発見を確認しています。

– 参加者は、技術の有効性は技術自体の可能性のある弱点ではなく、彼らのパフォーマンスのみに依存していると考えています。– 技術の複雑さに関する意見や技術に対する好みは、認識された有効性において役割を果たしていないようです。これらの結果は開発者と研究者にとって有用です。それらは以下を示唆しています：

– 開発者は自分の判断の限界を認識すべきです。

– 技術がどれだけ効果的かについて開発者にフィードバックを提供するツールを設計すべきです。

– 同時に容易に適用可能で効果的な技術の最良の組み合わせを決定すべきです。– 実証的結果を開発者が利用できるようにする手段を開発すべきです。

\ ここで紹介する研究に関連する資料はhttps://github.com/GRISE-UPM/Misperceptionsで見つけることができます。本論文は以下のように構成されています。セクション2ではオリジナル研究について説明します。セクション3ではその妥当性の脅威を提示します。セクション4では結果について議論します。セクション5ではオリジナル研究に加えられた修正に基づいて複製研究について説明します。セクション6ではその妥当性の脅威を提示します。セクション7ではこの複製研究の結果を報告します。セクション8では私たちの発見とその意味について議論します。セクション9では関連研究を示します。最後に、セクション10では本研究の結論を概説します。

\ \

:::info この論文は arxiv上で利用可能 であり、CC BY-NC-ND 4.0ライセンスの下で提供されています。

:::

市場の機会

WHY価格(WHY)

$0.00000001529

$0.00000001529$0.00000001529

0.00%

USD

WHY (WHY) ライブ価格チャート

免責事項：このサイトに転載されている記事は、公開プラットフォームから引用されており、情報提供のみを目的としています。MEXCの見解を必ずしも反映するものではありません。すべての権利は原著者に帰属します。コンテンツが第三者の権利を侵害していると思われる場合は、削除を依頼するために [email protected] までご連絡ください。MEXCは、コンテンツの正確性、完全性、適時性について一切保証せず、提供された情報に基づいて行われたいかなる行動についても責任を負いません。本コンテンツは、財務、法律、その他の専門的なアドバイスを構成するものではなく、MEXCによる推奨または支持と見なされるべきではありません。