第7回ケモインフォマティクス若手の会に行ってきました!
みなさん、こんにちは。
今回はKNIMEや、その他ツールの話はないです。ただの雑記。
先週のことですが、第7回ケモインフォマティクス若手の会に参加してきました!
私は若手とはお世辞にも言えない年齢ですが、"超ど素人" = "若手"と勝手に解釈して参加することにしてみました!
共感できるタイプ・できないタイプがいると思いますが、まあそれは不安でしたよ。残念ながら私は、あんまりおしゃべりが上手な方ではないですし、若さもない・ケモインフォの知識もない…。社内でも、お前みたいなおっさんが未経験分野の担当になって何の役に立つ?な空気を感じることもあります。確かに一理あると思います。
でも、だからこそ、ビビらずに外の世界に触れて、少しでもレベルアップしなくてはと思い参加を決めたわけです。
行って良かった!とても良い会だった!
実に語彙不足な感想ですが、とても良い会だと思いました。お偉方・学会の自己満足のために、高圧的な感じで催されるものではなく、運営スタッフの方々が、地道に温めてきた感じの伝わる会でした。またDeNAさんのサポートも大きですね。
実際のところ、なんだかよくわからない部分もありましたが、初学者でもわかるように噛み砕いた説明・講演を皆様が心がけてくださっていたり、また素人質問も遠慮なくできる雰囲気で、大変有り難かったです。*1
懇親会では、いろんな方とお話ししたり、名刺の交換等させて頂きました。有難うございました。またこういう機会があれば、積極的に参加していきたいと思わせてくれる会でした!
*1:素人質問というと、"相手をボコボコにする前置き"みたいな感じでとらえられることがあるようですが、ここでの意味はそういうものではないです。「おいおい、その程度のこと質問してんじゃねーよ」みたいな強張った空気は流れていないという意味です。
【随時更新?】当ブログタイトル一覧 〜ブログの情報取得もKNIMEでやるよ〜
みなさまこんにちは。
先日、にほんごであそぼ(NHK)で草枕をとりあげていました。
智 に働けば角 が立つ。
情 に棹 させば流される。意地を
通 せば窮屈 だ。とかくに人の世は住みにくい。
(青空文庫より)
有名な冒頭部分ですね。日々のストレス、 大型連休ですっきりさせたいものです。
さてさて、当ブログですが、アクセス解析(はてなブログの機能)を見る限り、100~200PV/日くらいのアクセスがあるようです。ありがたいことです。折角多くの方に見ていただいているので、内容をまとめて見ることにしました。経緯はこんな感じ↓
ですが、ただまとめても面白くないので、KNIMEを使って当ブログのタイトル一覧を作ってみました。タイトルは当該記事のポイントを表している(はず)なので、このテーブルは簡易的な"まとめ"と呼べるのでは?と思います。*1
テーブルを作ったフローについて解説を書きました。
興味のある方はご覧ください!
*1:と思ったが、実際作って見たらダサかった。もう少し見やすくした方がいいですね。反省しています。
【KNIME 】Excel?のMROUND関数と同じことをKNIMEでやってみよう!
新年度がスタートしましたね!
私はこの春から、新しいことに挑戦することになりました。これまでは薬品を混ぜたり、フラスコや試験管を触ったりする仕事をしていたのですが(いらすとやイメージだとこんな感じ↓)
4月からは、computerを使って化学する世界で頑張ることになりました。in silicoとかケモインフォマティクスとか、そういう感じのワード紹介される分野です。ゼロからのスタートなので不安も多いですが頑張ろうと思います。
同業?の方々との繋がりができることも期待しています。*1
さて、今日"Ari"さんからコメントを頂きました。
時間をキーに2つのテーブルを結合させようとしているのですが、片方のテーブルは5分きざみ、もう片方は30分きざみとなっています。時間をまるめる、mroundのような機能をご存知でしたら教えてください。
ちょっと実際の状況がイメージできなかったのですが、
上のような2つのテーブルを
こんな感じにしたいというようなことでしょうか?的外れだったらごめんなさい!
これをExcelのMROUND関数を使った風にして作成してみます。
*1:製薬会社の合成は、社外の方との横の繋がりを作りにくいんですよね。どうしても仕事の話をしようとすると構造式が無いとなかなか深い話はできないですが、構造出しちゃうとターゲットや社内の状況がダダ漏れになっちゃう。
【初心者レビュー】PyCharm使ったら、勉強が捗る!ちょいハードル下がる!
こんにちは。花粉が飛んでいますね。
さて、KNIMEの使い方を主な題材としている本ブログですが、前回
こんな記事を書いてみました。
記事内でも触れましたが、私プログラミングとか全然やったことないです。なので、pythonコード書く部分は結構時間かかりました。既存ライブラリを使ってるだけなので特に頭を使うこともなく簡単なはずなんですが、
- お作法がわからん場合が多い
- ライブラリ名、関数(class)名を知らない
など低経験値が引き起こす問題が結構あります。
で、少しずつ慣れていこう!と思って、もう一度復習してたんですが、
こんな記事が目について、PyCharmをインストールしみました。右も左もわからない私に、"最強"とかキャッチーなフレーズ。食いついてしまいました。
結果、入れてよかったです。
前回のtSNEのコードは何も見なくてもかけるようになりました。
インストールの方法とかは、色々と記事がありましたので割愛しますが、ど素人の私が覚えたいくつかの使い方を紹介します。
続きを読む【KNIME 】scikit-learnをKNIMEで動かすよ 〜t-SNEを題材に〜
みなさん、年度末が近づいてきました。色々と忙しい日々ですが体調には気をつけないといけません(私は、先日発熱しました…)。
さてさて、今回はKNIME上でpython書いて、scikit-learnを動かしてみます。
で紹介した可視化を、t-SNEを使ってやってみます。
その前に!
KNIME上でpython、どうやって使うの?に軽くふれます。
まず、python3を使いたければ、KNIME3.5以上が良い気がします(3.4でもいけそうですが)。
File >> preferencesと進んで、検索窓にpythonと入れれば、下のような設定画面にたどり着きます。ここに使いたいpythonの実行ファイルを指定すればOKです。私の場合はanacondaを使ってpython環境を用意しているので、所望のenvのbinの中のpythonを指定しています。
ここで、私のようなど素人+化合物情報を扱いたい&windowsユーザーの方!!!
RDKitってのを入れることになると思います。anaconda環境であれば
conda install -c rdkit rdkit
をすればinstallできますし、ターミナル・コマンドプロンプトやjupyterでは動くはずです。でもでも、KNIME上だと多分動かないです。同じようなことを言っている人がいましたので、リンクを貼っておきます。
私もlinux(centos7)、mac(sierra)では特に気になりませんでしたが、win7ではうまくいきませんでしたので、システム環境変数のPathに、anaconda系の足りない部分を強引に追記しました(強引だと思うので自己責任でお願いしますね)。
環境変数の足りない部分は
import os
print(os.environ["PATH"])
をrdkitが動く環境と、動かない環境(KNIME)でくらべてやればわかると思います。*1
前置きはこのくらいにします。
今回の全体像は次のようなものです。
以前と同様にNS5Bポリメラーゼ阻害剤関する5つの文献に記載されている化合物を、構造ベースでクラスタリングしていきます。過去記事ではKNIMEのMDSノードを利用して次元を削減し(対distance matrix)可視化を行いましたが、今回はdistance matrixを挟まず、fingerprintに対して直接t-SNEを用いて次元を落とし、可視化してみます。
t-SNE
次元削減法の一つで、人気なんだそうです。下記サイトが雰囲気を掴みやすかったです。
perplexityという調整可能なパラメータ…(中略)…は、おおざっぱに言うと、データの局所的な特性と全体的な特性のどちらをより考慮するか、そのバランスを表しています。
と書かれており、このパラメータを動かしながら可視化をやってみます。
*1:ここにたどり着くのに数時間かかった。動かすための環境を用意するので一苦労です。
【KNIME】お手軽に機械学習してみませんか? 〜random_forest_regression〜
久しぶりに記事を書きます。二児の親となり、家のことを忙しくしつつ、最近は機械学習をかじり始めました。始めたといっても、いろいろを触って、動かしてみている程度。きっちり取り組んでいる方には怒れらてしまいそうですが、様々なツールも出回り、コモディティ化が進んでいるなかで、まったくいじったことがないというのも良くないと思いまして。
今回は、"学習用データがある場合"に可能&お手軽簡単に数値予測ができるKNIMEのノード を紹介しようと思います。
Random Forest Learner & Predictor (regression)
最近の流行は、やっぱりdeeplearningだと思うのですが、それだけが全てではないです。現在、私もDeepChemを使ってDLに挑戦していますが、wetのケミストが気楽にアクセスできる感じではありません(プログラミング経験のある方なら、何とかなるかもしれませんが)。
そんな中、今回の方法
KNIMEを使って、ECFP4を入力としてRandom Forestで回帰する
は殆ど頭を使うことがないので誰でも使える!と断言できます(但し、得られる結果については個人で判断してくださいね)。では早速KNIMEのフローを見ていきます。
続きを読むあけましておめでとうございます&本のおすすめ
みなさま、あけましておめでとうございます。
それぞれ素敵な新年を迎えらえていることと思います。我が家も新メンバーを迎えて1ヶ月。バタバタしながらも無事に2018年をスタートさせることができました!
…2018年1月1日、0:00は息子のオムツ交換をしていましたが。
さて、ブログを書き始めて約半年が経ちました。
およそ約16,000回、私の書いた記事を読んでいただけたようです。自分の書いたものを読むために、こんなに沢山の方の時間を割いていただけている。とても嬉しいことです。
どんな人に読んでもらえているのかな?少しは役に立ってるのかな?など思いを巡らせています。コメントをくださった方もいらっしゃいました。ブログを通じて、新しいネットワークができること期待している部分もあります。
- 何をすればいいか分かりませんが、KNIMEのユーザー会ができたらいいなとか
- pythonやrdkitなどの先生的な人と繋がれたらなとか
- 子育てとか、その他もろもろ。
気が向けば、なんでもいいので是非コメントいただけると嬉しいです!
更新ペースに随分とむらはありますが、今後とも宜しくお願いします。
今回は本の紹介をしようと思います。
続きを読む