非プログラマーのためのインフォマティクス入門。(仮)

非プログラマーがインフォマティクスについて勉強したことを記録します。主にKNIMEというソフトを使用しています。

非プログラマーのためのインフォマティクス入門。(仮)

データは前処理が9割? ~KNIMEとそのインストール~

脱エクセル

ビッグデータだとか、データサイエンスだとか、近年よく耳にするワードかと思います。ただ、そんな流れに柔軟に対応できていない・できない人も多いと思うんです。

この取り残された側に筆者もいるのですが、周囲の状況としては

  • 古き良き時代?の紙ベース業務から、ようやくエクセルくらいは当たり前にはなっている
  • 手作業(コピペやデータ照合)を頑張ると、褒めれちゃう異常な環境

なんかが挙げられます。

エクセルは優れたアプリケーションだとは思います。初見でもある程度使えますし、知名度も高い。多様な処理も可能です。

一方で、初見で使えてしまうために"セルの結合"や"セル内の改行"など、後の解析等には不都合な処理が施されたデータが蔓延します。また多様な処理を実行するためにはエクセル関数を覚えたり、さらにはVBAなどを記述するスキルが必要です。

特にVBAのようなコード作成が必要になると、自分には無理だーと感じてしまう人も多いと思います。実際に私もその一員です。

そこで出会ったのが"KNIME"です。ナイムと読みます。

f:id:sumtat:20170721221233p:plain

ドイツのコンスタンツ大学というところが開発したアプリケーションです。

タダです。(ちなみにエクセルは有料)

続きを読む