ソフトウェア開発: 小規模でもスマートに

1月24日のワークショップ「小規模開発向け軽量プロセスのすすめ― 顧客信頼向上に役立つVSE標準の活用 ―」の講師の伏見です。

ソフトウェア開発の現場は、しばしば、小規模な開発組織、開発企業が担当しています。また、短期間開発の比重も高まってきました。そうした現場の作業環境は、なかなか高度化されず、いわゆる「現場の疲弊」が蔓延しているといわれます。疲弊の結果、現場の人々が明日の納期のことしか考えられなくなると、ますます泥沼的な作業に陥っていきます。開発技量が育成されないケース、開発環境が十分でないケース、開発環境はあっても有効に活用されないケース、いろいろな閉塞状況が懸念されます。かといって、あまり大げさに開発プロセスの改革にとりくむのも大変です。

幸い、最近、小規模組織向けの開発(プロセス)国際標準が開発されました。1月のワークショプでは、この標準の活用により組織の信頼性を高める方策を共に考えながら、国際討議、JIS化討議の結果等もふまえた活用法の基本的な着眼点をお伝えしたいと思います。明日の開発力向上、信頼性向上のためにぜひご参加ください。

カテゴリー: プロセス改善, フォーラムの運営, 未分類 | タグ: , , | コメントする

データ分析法について考えてみませんか?

来年3月8日のワークショップ「あなたのデータ分析法は間違っていませんか?~ ロバスト統計手法のすすめ ~」の講師を務める宮﨑です。

ソフトウェアは人間が知恵を絞って一つずつ作ります。機械を使って工場で大量に生産できるわけではありません。一つずつ、作る人も違うし、作る物も違います。ソフトウェアも一般工業製品のような機械的管理ができるのではないかという願望のもとに、管理図等の手法を導入しようという試みは、長い間なされてきましたが成功したと言える組織はどの程度あるのでしょうか。ソフトウェア開発にはあまりにも変動要因が多いのです。そして、技術の進歩の速さが、ソフトウェア開発をますます多様にします。ソフトウェアという多様性のある製品を、多様なプロセスで開発する過程から出てくるデータは、多様性のかたまりです。このようなデータを従来の統計的手法で扱っていたのでは、間違いをおこす確率が高くなります。3月8日のワークショップでは、ソフトウェア開発のデータをより適切に分析できる統計手法について、事例と演習により理解を深めていただきたいと思っています。皆様、奮ってご参加ください。

カテゴリー: 測定と分析, フォーラムの運営, 未分類 | タグ: , , , , , , | コメントする

3月までのワークショップ

事務所前のおかめ桜

秋も深まり、事務所前のおかめ桜も紅葉しています。
昨日の雨の後、今日は気持ちのよい晴天です。
2周年記念イベント“プロセス改善の集い”には多くのご参加をいただき、ありがとうございました。講演や意見交換では、ISO26262を取り巻く欧州、日本の動向に加え、ISO26262の意義、企業文化醸成の必要性、対応策等について語られ、有意義な半日でした。今回、機会を逸した方も含めて、次回をご期待ください。

さて、フォーラムでは1月から3月にかけて以下のワークショップを予定しています。他ではなかなか得られない内容豊富なコースです。皆様のご参加をお待ちしております。

小規模開発向け軽量プロセスのすすめ-顧客信頼向上に役立つVSE標準の活用
 2013年01月24日(木)  講師 伏見 諭(ふしみ さとし)氏

~ITも心の時代へ~ 「わくわく」感を生み出す人間重視の品質改善実践法
―品質マインド醸成法と改善活動への動機付けのコツ-
 2013年02月08日(金)  講師 関 弘充(せき ひろみつ)氏

あなたのデータ分析法は間違っていませんか? ~ロバスト統計手法のすすめ~
 2013年03月08日(金)  講師 宮崎 幸生(みやざき ゆきお)氏

カテゴリー: フォーラムの運営, 未分類 | コメントする

プロセス改善フォーラムよりご案内

プロセス改善フォーラム事務局の堀田です。学校も夏休みに入り、暑い日が続いていますが、皆様お元気でお過ごしでしょうか。
時が過ぎるのは早いもので、プロセス改善フォーラムも発足して既に2年近くが経過しました。これまでご参加、ご協力いただいた皆様には深く感謝申し上げます。
そこで、3ヶ月くらい先の話になりますが、2周年記念として、以下の集いを企画いたしました。万障お繰り合わせの上、是非ご参加いただけば幸です。この会はオープンな会ですので、どなたでも、勿論初めてご参加の方も歓迎です。席に限りがありますのでお早めにお申込ください。

(1)「プロセス改善フォーラム」2周年記念イベント
“プロセス改善の集い” 「ISO26262機能安全」最新情報と関連モデルの活用
– 最新情報を入手、そして真の効果に繋げるために
トップ講師による「ISO 26262機能安全」に関する最新情報や関連モデルの活用に向けたセミナーと意見交換の会を開催します。
10月 23日(火) 14:30~18:00
講師: 小谷田 一詞 ((財)日本自動車研究所)
    白  石   肇 (白石ソフトウェアプロセス改善ワークショップ)

また、ご好評にお応えしての第二弾、記念イベントと合わせ皆様のご参加をお待ちしております。

(2) 直ぐにソフトウェア品質を良くするコツ ― 短期成果追求型の品質改善実践法 ―

  講師: 関 弘充 (ヒューマン&クオリティ・ラボ)  10月24日(水) 10:30~17:30

(3)統計学を知らなくてもできる定量的データ分析 ~ナイチンゲールに学ぶデータ分析術~

  講師: 宮崎幸生 (富士通クオリティ・ラボ)     11月9日(金) 10:30~17:30

カテゴリー: フォーラムの運営, 未分類 | タグ: , , , , | コメントする

テューキーの探索的データ解析について(その3)

第2章に登場するのは5数要約 (5-number summary) と箱ひげ図 (box-and-whisker

plot) です。まず、5数要約について、以下のソフトウェアシステムの構成要素毎の詳細

設計レビュー工数(人時)を使って説明します。

一番左の列がレビュー工数のデータです。その右が小さいもの順につけた順位で、その右

が逆に大きいもの順につけた順位です。一番右の列が昇順ランクと降順ランクの小さい方

をとった「深さ」になります。このデータを、5数要約の基本形で表現すると、次のよう

になります。

#13はデータの件数です。下向きの箱の中に入っている5つの数字が5数ということにな

ります。 小さい方から数えても大きい方から数えても同じ7という順位になるのが中央

値 (median) です。順位の最小値1と最大値13を足して2で割っても同じ答えは出てき

ます。5数要約では、M7(Medianは深さ7)の右、下向きの箱の上部に88と書きま

す。

中央値の考え方を延長し、中央値と最小値の真ん中のデータを求めます。深さから計算す

ると(1+7)/2=4となり、28.9ということが分かります。中央値と最大値の真

ん中のデータも深さ4となり、222ということが分かります。この二つのデータをヒン

ジ (hinge) と言います。5数要約ではH4 (Hingeは深さ4)の右に小さい順に書きます。

最後に、深さ1の最小値と最大値を書いて、5数要約は完成します。

5数要約では、外れ値に関するルールと表記法も定めています。

・「H幅 (H-spread)」=二つのヒンジの差

・「ステップ (step)」= 1.5×H幅

・「内壁 (inner fences)」:ヒンジの1ステップ外側

つまり、内壁は二つあり一つは、最大値側のヒンジ+ステップ

もう一つは、最小値側のヒンジ-ステップ

・「外壁 (outer fences)」:ヒンジの2ステップ外側

つまり、外壁も二つあり一つは、最大値側のヒンジ+ 2×ステップ

もう一つは、最小値側のヒンジ- 2×ステップ

としたときに、

◇ 内壁の内側にあるデータの最大値と最小値を内壁隣接値 (adjacent)

◇ 内壁と外壁の間にあるデータを外れ値 (outside)

◇外壁の外側にあるデータを度外れ値 (far out)

と定めています。このルールに従って、レビュー工数のデータでそれぞれを求めてみると

以下のようになります。

・H幅=222-28.9=193.1

・ステップ=1.5×193.1=289.65

・内壁の最大値側:222+289.65=511.65

・内壁の最小値側:28.9-289.65=-260.75

・外壁の最大値側:222+2×289.65=801.3

・外壁の最小値側:28.9-2×289.65=-550.4

◇内壁隣接値:12, 325.6

◇外れ値:702.6

◇度外れ値:なし

5数要約の基本形に、内壁、外壁、内壁隣接値、外れ値等を書き加えた表記法が以下です。

これらのデータが揃うと箱ひげ図が描けます。箱ひげ図は二つのヒンジを上辺、下辺とす

る箱の中に、中央値を描き、上辺、下辺から内壁隣接値までをひげのような線で結んだ図

です。以下に、上記データを使って箱ひげ図の例を示します。箱から伸びた上下のひげの

末端にある黒い ▬ が内壁隣接値で、赤い ▬ が中央値、青い ● が外れ値です。

今回は、5数要約と箱ひげ図の紹介をしました。なお、EXCELのQUARTILE関数により

計算される四分位数は、データ件数にもよりますが、テューキーのヒンジの計算結果と多

少異なります。EXCELやRが普及したこともあって、最近の書籍では、箱ひげ図の上辺

や下辺の定義にはEXCEL等による四分位数を使うことが多いようです。

 

カテゴリー: 測定と分析, 未分類 | タグ: , , , , | コメントする

テューキーの探索的データ解析について(その2)

前回はヒストグラムの説明をしました。今回は、いよいよ探索的データ解析の中身に入っていきます。第1章に登場するのが幹葉図 (stem-and-leaf) です。幹葉図は、カンヨウズと読んだりミキハズと読んだりするようです。前回のヒストグラムの説明で使った、以下のソフトウェアシステムの構成要素毎の詳細設計書枚数で、幹葉図を描いてみます。

285, 38, 321, 1060, 501, 1080, 136, 265, 106, 986, 45, 471, 422, 185, 1072, 269,

889, 2453, 82

幹葉図を描くのにExcelは不要で、単に次のようにデータを並べればよいのです。

**には00~99の数字が入ります。例えば1**は、100枚~199枚というヒストグラムで言えば一つの区間を意味します。同様に、***には000~999の数字が入ります。幹葉図の作り方は、データの最小値と最大値を考慮し、まず、縦線の左側に0**から2***までの区間を作っておきます。このようにしておけば、後は数字が並んでいる順 (285, 38, 321, ・・・, 82) に各区間にデータの下2桁(1000以上になったら下3桁)をコンマで区切って描いていけばよいのです。こうすることで、データを大きさの順に並べ変えるといったことはしなくても、間違えることは少なくなります。

以下は、前回のヒストグラムです。

お分かりのように、ヒストグラムを縦にするとほぼ幹葉図になります。ヒストグラムの各棒の長さが、幹葉図の縦線の右側の数字の数になることが分かります。ほぼ幹葉図と書いたのは、この幹葉図だとヒストグラムに比べて外れ値は一見分かりにくくなるからです。幹葉図の場合には、*の数に気を付けなければなりません。9**までは区間の幅は100なのですが、1***からは区間の幅が1000になるのです。したがって、ヒストグラムと同じイメージを保ちたければ、区間の幅を10**, 11**, 12** ・・・と最後まで100で統一すればよいのです。かなりのスペースはとることになりますが、ヒストグラムと同様の図にすることができます。

ヒストグラムだと元のデータの正確な値は分かりませんが、幹葉図なら分かります。並べ方を工夫しただけで、元のデータをそのまま描いたのが幹葉図なのです。この単純な発想の素晴らしさには脱帽です。

ヒストグラムのときに悩む区間の幅についても、幹葉図であれば悩むことはありません。10とか100といった幅で描くことになるのです。しかし、10や100だと粗過ぎて分布がよく分からない、という場合には、英語民族の発想ではありますが、次のようなアイディアも書かれています。

# :0と1        注)参照

t :2 (two) と3 (three)

f :4 (four) と5 (five)

s :6 (six) と7 (seven)

・:8と9

例えば、以下のようなデータがあったとします。

27, 28, 15, 23, 14, 12, 12, 15, 16, 11, 22, 14, 15, 13, 10

これを、以下の幹葉図にします。

これでは分布がよく分からないというときに、次のようにします。

これで、分布が少し見えてくるというわけです。

探索的データ解析には、この他にも様々な表現方法を使った幹葉図が、これでもかというほど出てきます。ちょっとした工夫で、どんなデータにでも使えるから考えてごらん、と言われているような気になります。

注)原著は0と1の記号は、# ではなく* を使っています。今回のブログでは * は、0~9の意味で統一した方が分かりやすいと思いましたので # を使いました。

 

 

カテゴリー: 測定と分析, 未分類 | タグ: , , , , , , , | コメントする

テューキーの探索的データ解析について(その1)

私が今、勉強している本に、John W. Tukey(テューキー)のExploratory Data Analysis(探索的データ解析)があります。テューキーはアメリカの数学者、統計学者で、仮説検定ばかりが重視されていた時代に、記述統計学の重要性をうったえ、ロバスト統計学への流れを創った人物です。統計学のピカソと言われているくらい、統計学の様々な分野に業績を残しています。統計学以外の分野にもいくつも業績があり、例えば、高速フーリエ変換なども彼の業績の一つです。このような輝かしい業績の割には、日本ではあまり知られていません。探索的データ解析は700ページ近い大著で、1977年に出版されていますが、未だに翻訳されていないのが残念です。中を見ると、見慣れない手書きのグラフや数字の羅列がやたらと出てきます。箱ひげ図が紹介されたのもこの本です。おもしろいことに、数学的業績の多いテューキーの本とは思えないくらい、難解な数式は一つも出てきません。本の表やグラフで使われているほとんど全ての数値データは実際のデータであり、エネルギー、自動車といった産業界から化学、地理といった学問領域にまで亘っています。こうした広い領域で数値データを見てきたからこそ、探索的データ解析に辿り着いたのではないかと思えるほど、多様性に富んだデータが扱われています。

今日から何回かに分けて、探索的データ解析の本の中からソフトウェア関連の数値データの分析に役立ちそうなものを、このブログで紹介していきたいと思います。1回目の今日は、探索的データ解析の内容ではありませんが、探索的データ解析の手法と比較するために、ヒストグラム(度数分布図)を説明しておきます。以下のデータは、あるソフトウェアシステムの構成要素毎の詳細設計書枚数です。

285, 38, 321, 1060, 501, 1080, 136, 265, 106, 986, 45,

471, 422, 185, 1072, 269, 889, 2453, 82

このデータのヒストグラムを描くには、Excelのアドインにある分析ツールの中のヒストグラムを使います。ヒストグラムを描くときにいつも悩むのは、いくつの区間に分けるかということです。区間の数を決めるための方法として、スタージェスの公式など一般的な方法はいろいろあるようですが、どんなデータでもこの方法でよいといった万能の方法はありません。実際には、理論的な分布が分かっているような場合を除いては、対象とするデータとその特性などを考えながら、データに応じて試行錯誤を繰り返して決めることになると思います。ここでは、とりあえず、100枚を一つの区間としてヒストグラムを描いてみました。

次回は、探索的データ解析の中で紹介されている幹葉図 (stem-and-leaf) を、このヒストグラムと対比する形でご紹介したいと思います。

カテゴリー: 測定と分析, 未分類 | タグ: , , , , , , | コメントする

アセスメントに求めるもの(その2)

ここでいうアセスメントは、プロセスアセスメントです。プロセスアセスメントは、一般的にCMMIやAutomotive SPICEなどのベストプラクティスモデルを用いて行います。プロセスアセスメントは、組織のプロセス上の強み、弱み、リスク、改善の機会を明らかにすることを目的としていますが、いつの頃からか、何故か組織の成熟度やプロセス能力レベルを評価する(あるいは判定する)のがアセスメントという捉え方が定着してしまっているように思います。CMMIやAutomotive SPICEが、成熟度や能力レベルを定義しているので、ある意味うなづける部分もあるのですが、内容が伴わずレベルという言葉が独り歩きしてしまっているようです。
そして、「どうすればレベルを取得できるのか」、とか、「モデルに従って忠実に実施すればよい」といった考え方になり、挙句に、労多くして益少なしといった結果に終わってしまうということが多いのではないでしょうか。発注で求められるから仕方なく取り組むといった場合、いやでもこれを維持するとすれば、供給者サイドはもとより、発注者も浮かばれません。

SECの議論で、「問題(課題)ベースの改善」と「モデルベースの改善」を対比した議論がありましたが、このような対比をしなければならないくらい、現状の取り組みが歪んでいることを窺わせます。 問題や課題への対策を抜きにした改善など有り得ないと思いませんか?  問題や課題を浮き彫りにし、それを解決するための糸口を見つけたり、対策を優先順位付けする手段として、モデルやアセスメントはあるはずです。レベルに拘泥するあまり、本来の目的を見失ってはいないでしょうか。

カテゴリー: アセスメントモデル/手法, 未分類 | タグ: , , , | コメントする

アセスメントの意味に関連して=ISO9000陣営の模索と背景

伏見です。堀田さんの問題提起への直接の回答コメントではありませんが、この機会に、ISO9000推進陣営でも、当然、各種批判への自己点検はしているらしいこと、およびそれに関連する話題を記録しておきます。
第17回JAB/ISO 9001公開討論会(2011年3月16日)のプレゼンからの抜粋

WG1:QMS能力実証型審査 基本的考え方と計画
http://www.jab.or.jp/news/2011/att/11020800-1.pdf
1-1. QMS能力実証型審査とは(2)
・有すべきQMS能力像 vs ISO9001の要求 vs 組織の能力
→適合の判断は、「意図」への適合、「形式」への適合ではない(画一的判断からの脱却)
→規格の意図を満たしている=保証できるQMS「能力」を有している(以降3年間の認証期間を前提として)

同日の他のプレゼンは:
WG2:QMS能力実証型審査の方法と実施
http://www.jab.or.jp/news/2011/att/11020800-2.pdf

WG3:組織の視点でのQMS能力 実証型審査の価値の追究
http://www.jab.or.jp/news/2011/att/11020800-3.pdf

ちなみに、ISO9000の実務者には、こうした動きへの反論(反感?)も多いようです。
http://www.ms-jitsumu.com/sub62-01-95.html

関連して、古いエッセーですが:
ISO9000と経営の日本化(H12年9月4週号)
http://www.n-souken.com/news/news066.html

もっとも、そうはいっても、トヨタ方式も多難:
http://www1.harenet.ne.jp/~noriaki/link72-6.html

http://www.eco.nihon-u.ac.jp/center/economic/publication/pdf/10-04ikemoto.pdf

http://web.iss.u-tokyo.ac.jp/~marukawa/keieikanri.pdf

カテゴリー: アセスメントモデル/手法, 未分類 | 2件のコメント

アセスメントに求めるもの

ISO9001とCMMは、ほぼ同時期に欧州と米国で生まれましたが、CMMが広まりだした頃、日本ではISO9001が先行していました。その当時、それらの違いについて質問があり、私は、ISO9001はCMMのレベル3相当でしょうといった記憶があります。これは全く間違いとは言えないでしょうけれど、大雑把すぎる議論だとも思います。

同じである部分、同じでない部分いろいろある中で、大きな違いの一つとして、CMMは「shall」を使っていないということがあります。「shall」はISOの世界では要求事項を意味します。 一般にCMMやCMMIはベストプラクティスのモデルと言われます。会社で使用しているプロセスがモデル通りであるかどうか、あるいは、モデルを守っているかどうかが重要なのではなく、ビジネスにとって有効かどうかが重要です。プロセス能力が高い、成熟度が高いということは、プロセスがビジネス上の目標達成にそれだけ有効でなければならない道理です。でも、もしそうならないことがあるとしたら原因は何でしょう。皆さんはどう思われますか?

カテゴリー: アセスメントモデル/手法, 未分類 | タグ: , , , , | コメントする