非プログラマーのためのインフォマティクス入門。(仮)

非プログラマーがインフォマティクスについて勉強したことを記録します。主にKNIMEというソフトを使用しています。

非プログラマーのためのインフォマティクス入門。(仮)

【PyMOL】どこが違うのかな?

今日は有給なので、久しぶりに生存報告です。

生きてます!

さて、我が家の子供たち(自分も含む)はサイゼリヤが大好き。間違い探しも大好き。

ということで、今回は「タンパク質のアミノ酸、違うのどーこだ?」をやってみましょう。

続きを読む

買ってよかった2021

2021年はKNIMEの布教とか、そういうのはあんまり注力せずに、

  • FMOやSAPT計算
  • Flaskでweb app作成

みたいなことを頑張ってました。インプットに割く時間が多すぎてブログ書く余裕なかった。

年末だし、気楽に書ける記事をひとつ書いてみることしました。

それでは「買ってよかった2021」いっきまーす!

f:id:sumtat:20211230205451p:plain

続きを読む

【KNIME】"複数のシートを持つエクセルファイル"を"複数読み込む"には?

みなさーん、おひさしぶりですー!前回の更新から1年半が経ったようです。私、なんとか生きてますよ。

ずいぶんと更新していませんでしたが、今日こんなコメントを頂きました("まさん"、ありがとうございます)。

複数シートを持つファイルを複数読み込むことは可能でしょうか?

シートという単語から勝手にExcelファイルのことだと推測しましたが、もちろん可能です!コメント欄に方法を書くのは難しいので、ざーっと記事にしました。"まさん"の想定している場面に適したサンプルではないかもしれませんが、下記のようなファイルで試してみます。

f:id:sumtat:20211228162513p:plain

f:id:sumtat:20211228162609p:plain
f:id:sumtat:20211228162626p:plain

読みたいファイル群を002_exampleというフォルダ内に全てぶちこみます。各ファイルには"部署A","部署B"のように複数のシートを持っています。これらの3ファイル×各2シートの計6シートを読み込んでみましょう!

続きを読む

【買って良かった!】Deco m9 Plus (+ 熱対策) 〜家の中がwifiで塗りつぶされるよ〜

みなさん、こんにちは。

”新しい生活様式” いかがお過ごしですか?保育園が休みだったのは大変でしたが、引きこもりは私には向いているようです。今回は家のネットワークの話です。

f:id:sumtat:20200612231511p:plain

 在宅勤務中は(妻も含めて)、web meetingの頻度がかなり上がりました*1。ですが、我が家のネットワークはちょっと不安定だったため、ルータ(アクセスポイント)を新調しようということになりました。リビングにある母艦付近では、比較的安定しており100Mbps程度出るのですが、同じ部屋にテレビがあって、外に遊びに行けない子供達がyoutube(覚えちゃった)を見たがるので会議できない。で、書斎に行くとwifi電波が弱いし切れる。中継器使ってもだめ。ということでTP-link Deco m9 Plusを購入しました。

 詳細はググればいっぱいでてくるので割愛しますが、個人的にはとても良い買い物でした!本当に家の中がwifiで塗りつぶされた感じです。 電波の弱かった書斎(酷い時は1 Mbpsでないことも…)でも、すぐにネットワークが切れていた寝室でも、どこでも変わりなく一様に300 Mbpsくらいの下り速度が確保できるようになりました。

 設定も、これまで使っていた某バ◯△ローのわかりにくくて洒落てないUIと違って、素人でも簡単にできるようにスマホアプリが用意されています。bluetooth接続も上手く活用されていて、「はー最近の機種は便利だなー」と驚きました。壁掛けもあるから、机上じゃなくても設置可能ですよ。とてもオススメです!

 

 ただ、このdeco m9 plusなんですが、結構熱を持ちます。ルータあるあるかもしれませんが対応した方が良さそうです*2。そこでUSBファンを買いました。 

 1400円くらいだったな?これが大当たりです。

f:id:sumtat:20200612233319p:plain
f:id:sumtat:20200612233402p:plain
左: ぴったりサイズ 右: USBポートから電源とれるよ

 ちょうど良いサイズなんですよね。乗っけるだけでかなり熱問題は解消されると思います。ちなみにdeco m9本体にUSBポートがついているので、電源はそこから取れます。USBにハードディスクをつなぐ運用の方もいらっしゃると思いますが、私はLAN→NASなのでUSBポートが余ってたのでちょうど良かったです。そんなに高くないので、他のルータやプレステなどの機器にもオススメです。

 ただのお買い物話でした。最後に、息子氏(2)が最近びじゅチューン! - NHKにどハマりしてまして、DVDを見てるうちに勝手に覚えた「ひまわりがお掃除しちゃうわよ」の様子をお伝えして、今回はおしまいにします。あー、なーんにもしたくない!

ではでは!

 

*1:まあ、若干愚痴らせてもらえば、「やっぱり無駄なmeetingが多い」。web meetingになれないオジサマ達がちょっと慣れたら、やたら会議を設定したくなる。在宅でやることが少なくなってきて、とりあえず会議を設定しちゃおうか。みたいな感じがちらほら…。

*2:以前使っていたもの[某バ◯△ロー]は、熱くなってネットワークが切れることが多かった

【KNIME】現場向け、自動化ツールとしてのKNIME

あけましておめでとうございます…?

はい、今年初めての記事です!

f:id:sumtat:20200321222436p:plain

COVID-19対策で色々と活動が制限される日々が続きますが、みなさまいかがお過ごしでしょうか?嫌なこと・困ること、私にもありますが、マスクがないのは本当に困りますね(花粉にやられる)。

 

さてさて、今日こんな記事を見つけました。

一部を抜粋させて頂きます。

また、ツールの動作がPythonのパッケージに依存する場合、「pandasは0.25.1を入れて、openpyxlは3.0.0を入れてください。、、」とお願いするのは無理があります。環境構築なしで実行できる形で渡す必要があります。

ここ、結構なポイントだと思うんです。環境構築って超重要ですし、難しい。

ひょっとするとこんな声も聞こてくるかもしれません。例えばcondaならyamlから環境作ってもらえば…とか、そもそもdocker imageを配れば...とか。

そんなのはまず無理です!

excel処理の自動化などが求められるような現場で、仮想環境の構築をすんなりとシステム部が認めてくれる気が個人的にはしないですし、たぶんまず「仮想?なにそれ??」みたいになって現場で会話が成立しない(python使おうとして、仮想じゃなくて実環境だったとすると、いろいろ汚して社内の基幹ツールの動作に影響を与えるのも怖いですし)。

exe化して配布というのは私もよく考えます。が、osに依存する気がするし、場合によりexeが重くなる。あと、カスタマイズ性がない。カスタマイズに関しては必要ないとも考えられるんですが、私は「技術に関して、周囲に知ってもらう・興味を持ってもらう」という意味で、多少弄れる状態ってものアドバンデージがあると思っています*1。もちろん運用としては例外を設けたくないので、必要に応じて個人レベルでのスキルアップにつなげてもらうという意図です。

そういう観点で、KNIMEはオススメできるツールだと思います*2

  • 基本的に無料
  • OSに依存しない
  • 環境構築が容易(というか、実行環境についてほぼ気にしなくてよい)
  • GUIツールで、可読性が高い
  • 学習のコストが低い(スキルの頭打ちは必ずやってくるが…)

最新版ではありませんが、KNIMEの導入方法は

【KNIME】KNIMEのインストール 2018 ver. - 非プログラマーのためのインフォマティクス入門。(仮)

使い方の基本事項は

KNIME〜入門編〜 カテゴリーの記事一覧 - 非プログラマーのためのインフォマティクス入門。(仮)

などに、稚拙ながら記事として纏めていますので、覗いて頂ければ嬉しいです。

 

現場のニーズを捉えることはもちろん重要です。それに加えて、各個人が僅かな学習コストで問題を解決できる様に各種ツールの布教活動等をすることも、所属組織への貢献になるかなと考えています*3。ですので、私のブログでは専門的な話にはあまり内容を持って行かずに、広く一般的に作業の効率化に繋がりそうなKNIMEの使い方を書くようにしています。

冒頭にも触れましたが、COVID-19で身動きが取りにくい状況です。逆手にとって、KNIMEをちょっといじってみませんか?

 

それでは、また次回!!!

*1:興味持ってもらわないと、使ってもらえなかったり、場合によっては崇高な手作業・手計算をサボって遊んでるんだろ!とか苦情が入る場合もありますからね

*2:もちろん、いろんな選択肢がある中での1つとしてです。特定のツールに固執する必要は全くないと思いますし、おそらくそれは有益ではないです。

*3:簡単な作業自動化を皆ができる様に底上げして、その間に自分がもう少し高度な処理ができるように研鑽する時間も作れます。

【KNIME】KNIMEで作った予測モデルを配りたい

お久しぶりです。気が付けば年末です。皆様いかがお過ごしでしょうか?

傍から見れば、意味が無かったり・スピードがゆっくりに見えたり、場合により私の能力の低さに対して不愉快な印象をもつ方も周囲にはいるようですが、個人的にはinputを積極的に続けている日々です。集団ってのは怖いものです。

さて、今回は"KNIMEで作ったモデル"を配りたいときにどうするか?というショートな記事です。ニッチな内容です。

f:id:sumtat:20191226223047j:plain

さてさて急に話が始まりますが、scikit-learn(python機械学習するときに使えるとっても便利なライブラリ)などでモデル作って、「joblib(やpickle等)でdumpしたからどうぞー」みたいなことをされても、受け取る側が???になる場合ってのがあるわけです。"まずはKNIMEでやりたいの!"っていう需要があると思うんです*1。で、今回のタイトルのように学習済みのモデルを配布したいという場面に遭遇した場合、KNIMEはメモリを結構喰うので、学習に必要となったデータ量が大きかったり・処理が複雑だったりするとワークフローをそのまま提供すること自体気が引けるし、相手のマシンスペックによっては動かない場合も想定されます。

でも、まあ心配は要りません。ちゃんと学習済みのモデルを保存できますよ!irisデータセットを使って、雑ですが試してみましょう!

*1:逆に言えば、pythonなどを使いたくなった時には、KNIMEでやってたことをコードにすればいいので、なんとなくできそうなことが想像し易い。調べるきっかけができるというのは助かるはず

続きを読む

【KNIME】インフォコムさんがメールサポート始めるんだって

皆さん、お久しぶりです。

急に暑くなりました。体調を崩していないでしょうか?私は、なんか心も体も疲れちゃってる感じですね。身の回りのことで手一杯になり、なかなかブログの更新もできない。

 

さて、今は車の点検で外出中。ちょっと時間ができたので、ぼけーっとtwitterみたりしてたら、こんな情報が目に入りました。

www.infocom.co.jp

KNIME、やっぱり流行ってきてるんですかね?ちょっとサービス内容を見てみました。

  • Silver: ¥450,000/year (標準ノードのみ、ver.4以上・最大50件)
  • Gold:  ¥900,000/year (含コミュニティノード、ver.3以上・最大100件)

だそうです…。

 

企業など、こういう形態が好まれる場合もあると思うので、選択肢の一つとして良いと思いますが…。

個人的な感想としては高い!ですね。オープンソースで金…。まあ、システム連携などの部分では仕方ないかなって気もしますが。

日本語の情報は確かにあんまり無いんですけど、KNIMEはKNIME Community Forumも充実してます。自分は英語殆ど読めないですけど、google先生もそばについていてくれるので、なんとかなります。使う側も、ちょっと頑張るくらいがちょうど良いんじゃね?と思います。

サポートで金もいいんですけど、KNIMEの国内communityとか作っちゃえばいいんじゃないですかね?

www.knime.com

↑こんなんとか、海の向こうではめっちゃやってるし。ユーザーを拡大した上で、高いレベルでのサポートが売りでっせ!みたいすればいいのに。KNIME server導入にも繋がるかもしれないし。(インフォコムさん、これは批判ではないのです。期待を込めてです。気分を悪くなさらないでくださいね)

さて、最近ではKNIMEに関する情報(国内)も増えてきているんですよ!

たまにはちょっとソフトウェアtymsk3891.hatenablog.com

古株さんだと思います。私がKNIMEを使い始めたころ、国内にユーザーはいるの?とか思ってたんですが、初めて「おー!いたいたっ!」ってなったブログです。KNIMEの更新毎に、その内容をまとめていたり、渋い小技などを記事にされたりしています。

t_kahi's blogwww.t-kahi.com

KNIMEを使った統計的な解析・conventionalな機械学習法の利用などを、Rとの対比を行いながら非常に丁寧にまとめられています。その他にも、薬理・生物系研究者が普段の作業で活用できそうな内容なども積極的に記事にされています。

このあたりは大変参考になると思います。

また、「そんなにハードな内容」or「ぼんやりしすぎの内容」でなければ「これ、どうやるの?」みたいなのをコメントで頂ければ、"私のできる範囲であれば"記事にします。仕事じゃ無いんで、クオリティはイマイチかもしれませんし、もちろん秘密保持が必要なやつとかは無理ですよ。でも無料です。お気軽にどうぞ。

なかなか更新していませんでしたが、なんとか生きてます。気が向いたら、覗きにきてくださいねー!

では、また次回。