データは前処理が9割? ~KNIMEとそのインストール~
脱エクセル
ビッグデータだとか、データサイエンスだとか、近年よく耳にするワードかと思います。ただ、そんな流れに柔軟に対応できていない・できない人も多いと思うんです。
この取り残された側に筆者もいるのですが、周囲の状況としては
- 古き良き時代?の紙ベース業務から、ようやくエクセルくらいは当たり前にはなっている
- 手作業(コピペやデータ照合)を頑張ると、褒めれちゃう異常な環境
なんかが挙げられます。
エクセルは優れたアプリケーションだとは思います。初見でもある程度使えますし、知名度も高い。多様な処理も可能です。
一方で、初見で使えてしまうために"セルの結合"や"セル内の改行"など、後の解析等には不都合な処理が施されたデータが蔓延します。また多様な処理を実行するためにはエクセル関数を覚えたり、さらにはVBAなどを記述するスキルが必要です。
特にVBAのようなコード作成が必要になると、自分には無理だーと感じてしまう人も多いと思います。実際に私もその一員です。
そこで出会ったのが"KNIME"です。ナイムと読みます。
ドイツのコンスタンツ大学というところが開発したアプリケーションです。
タダです。(ちなみにエクセルは有料)
続きを読む