非プログラマーのためのインフォマティクス入門。(仮)

非プログラマーがインフォマティクスについて勉強したことを記録します。主にKNIMEというソフトを使用しています。

非プログラマーのためのインフォマティクス入門。(仮)

【超入門(3/3)】KNIMEの使い方 〜エクセルファイルとして書き出してみよう(Excel Writer)〜

前回までに KNIMEを使って、【エクセルファイルを読む】→【欲しい行を残す】というとこまでフローを書きました。

 

 

sumtat.hatenablog.com

今回は【超入門】シリーズの締めとして、

  • エクセルファイルとして書き出す
  • 作成したWorkflowを保存する

の2つについて書いていこうと思います。

 

〜追記:2021/05/27〜

KNIME 4.3.xから、Excel Reader/Writerが新しくなっているようです。キャプチャ画像が旧バージョンのままになっていますが、ご容赦ください。(sattleさん、コメント有難うございました!)

 

続きを読む

【超入門(2/3)】KNIMEの使い方 〜欲しい行だけ抽出しよう(Row filter, splitter)〜

前回はExcel Readerを使ってエクセルファイルを読み込んでみました。

 

sumtat.hatenablog.com

 ちなみに、Excelをインストールしていなくても、中身にアクセスできますよー。

 

さて、サンプルとして

f:id:sumtat:20170723160755p:plainこんな感じのデータを読み込みました。今回は宣言どおり、性別が男性のデータのみを抽出しようと思います。

 

続きを読む

【超入門(1/3)】KNIMEの使い方 〜エクセルファイルを読んでみよう(Excel Reader)〜

KNIME Workflow

KNIMEの超基本的な使い方を数回に分けて書いてみます。

まずKNIMEを起動すると、多少レイアウトが違ったりするかもしれませんが、概ねこんな感じになるとおもいます。f:id:sumtat:20170723144131p:plain左上の赤枠内の小さな▼をクリック後、New KNIME Workflowを選択します(File→ニューでも構いません)。そうするとこんな感じの画面ができます↓。Nameはtestとしておきました。f:id:sumtat:20170723144621p:plainFinishすると真っ白の領域がでてきます。ここが作業場です。赤枠内のNode repositryの中から自分のやりたい作業に適したもの(node)を探します。すごくたくさんあるので、検索窓にnodeの名前の一部をいれると、早くたどり着けます。今回はまずエクセルファイルを読んでみようと思うので、【Excel Reader (XLS)】をダブルクリックする or ドラッグ&ドロップで作業場所に引っ張ってきてみましょう。f:id:sumtat:20170723145453p:plain

続きを読む

KNIMEをフル装備化(無課金)

インストールに関するおまけ

前回、KNIMEとそのインストールに関して記事にしました。  

sumtat.hatenablog.com

ざっくりもう一度まとめると、KNIMEの公式ページから各自の環境(OS)に対応した

KNIME Analytics Platform + all free extensions

をダウンロードして実行しよう!というものです。

extensionというのが、KNIMEの装備みたいなものです。

もう少し具体的には、【エクセルファイルを読む】とか、【欲しい行だけ残す】などの個々の作業に対応する箱(KNIMEではノードと言います)のセットのことを指します。

起動が遅くなるから、KNIME Analytics Platformだけにして、あとから自分の好きなextensionsを追加すればいいという意見もあるようですが、とりあえず"全部のせ"にしておけば間違いないということで、個人的には+ all free extensionsがオススメなのです。(そもそも初めて使うのに、どれが必要で、どれが不要か?なんてわかんないですし)

 

が、しかし

これではまだフル装備ではないんです。 all free extensionsとか言ってるのに、まだおまけがあるんです!今回は、このおまけをgetする方法について書こうと思います。

 

続きを読む

データは前処理が9割? ~KNIMEとそのインストール~

脱エクセル

ビッグデータだとか、データサイエンスだとか、近年よく耳にするワードかと思います。ただ、そんな流れに柔軟に対応できていない・できない人も多いと思うんです。

この取り残された側に筆者もいるのですが、周囲の状況としては

  • 古き良き時代?の紙ベース業務から、ようやくエクセルくらいは当たり前にはなっている
  • 手作業(コピペやデータ照合)を頑張ると、褒めれちゃう異常な環境

なんかが挙げられます。

エクセルは優れたアプリケーションだとは思います。初見でもある程度使えますし、知名度も高い。多様な処理も可能です。

一方で、初見で使えてしまうために"セルの結合"や"セル内の改行"など、後の解析等には不都合な処理が施されたデータが蔓延します。また多様な処理を実行するためにはエクセル関数を覚えたり、さらにはVBAなどを記述するスキルが必要です。

特にVBAのようなコード作成が必要になると、自分には無理だーと感じてしまう人も多いと思います。実際に私もその一員です。

そこで出会ったのが"KNIME"です。ナイムと読みます。

f:id:sumtat:20170721221233p:plain

ドイツのコンスタンツ大学というところが開発したアプリケーションです。

タダです。(ちなみにエクセルは有料)

続きを読む