非プログラマーのためのインフォマティクス入門。(仮)

非プログラマーがインフォマティクスについて勉強したことを記録します。主にKNIMEというソフトを使用しています。

非プログラマーのためのインフォマティクス入門。(仮)

chem

【KNIME 】scikit-learnをKNIMEで動かすよ 〜t-SNEを題材に〜

みなさん、年度末が近づいてきました。色々と忙しい日々ですが体調には気をつけないといけません(私は、先日発熱しました…)。 さてさて、今回はKNIME上でpython書いて、scikit-learnを動かしてみます。 で紹介した可視化を、t-SNEを使ってやってみます。 …

【KNIME】お手軽に機械学習してみませんか? 〜random_forest_regression〜

久しぶりに記事を書きます。二児の親となり、家のことを忙しくしつつ、最近は機械学習をかじり始めました。始めたといっても、いろいろを触って、動かしてみている程度。きっちり取り組んでいる方には怒れらてしまいそうですが、様々なツールも出回り、コモ…

KNIMEで化合物をクラスタリング&可視化してみよう

みなさん、こんにちは。 私は急な気温の変化と、ブタクサ?花粉で体調がイマイチです。 心はあまり元気でないので、せめて体は元気で過ごしたいものです。 さて、今回は何について書こうかなーと考えていたのですが、前回、ChEMBLからとってきた情報を使って…

KNIMEを使ってChEMBLから情報をとってくるンゴ

なんだか、最近巷ではなんJ民が溢れているそうですね! headlines.yahoo.co.jp おさぼりおじさんが、日中よく読んでいる*1というyahooニュースで取り上げられているくらいなので、間違い無いですね。驚きですね。 さて、毒吐きから始めてしまいましたが、今…

【超入門】Loopを回せ! 〜KNIMEを使って複数のファイルを一気に読んでみよう〜

勝手に偉そうな命名をした"超入門シリーズ"ですが、これまでに ファイルの読み方 (エクセルファイルを例にして) 変数の使い方 について紹介してきました。 さていよいよ今回はループの回し方について紹介したいと思います。 この3つが揃えば、データサイエ…

【メドケム】KNIMEでリガンド効率を計算するよ 〜言い換えれば、ただの四則演算〜

今回は四則演算の題材としてLE(Ligand Efficiency, リガンド効率)の計算をしてみます。もはや説明の必要もないかもしれませんが、ざっくりと言えば、 "水素以外の原子1つ1つが、どのくらい頑張って活性に貢献してるの?" みたいな感じでしょうか。ずいぶん…

KNIMEで構造検索をしよう

今回は読み込んだsdfの構造式に対して、絞り込みを行う方法を紹介します。 全体像としてはこんな感じ↑です。構造で絞り込む処理をするノードはいくつかありますが、今回はIndigo2のSubstructure Matcherを使います。これは私の単なる好みです。ほとんど同じ…

KNIMEでChemdrawファイルを読みたい 〜 Chemical Structures File Reader〜

以前にsdfの読み方を紹介しました。 『構造式の入ったファイルありますか?』 →『cdxなら有るんだけど…。』 みたいなことを言われるパターンもあるんですよね。該当ファイルが1つ2つなら、手動で開いてsdfとして保存し直す。これでいいんですが、もっと沢山…

エクセルファイルに構造式を入れたい

エクセルは便利ですし、市民権も獲得していて、データのちょっとした共有などによく使われます(少なくとも私の周りの環境では)。 でも、エクセルで構造式入りのファイルをつくるとなると「純手作業」では結構めんどくさいですよ(ハイパーコピペモード突入)。…

【メドケム】KNIMEで構造式を扱おう 〜sdfを読んでみよう〜

突然ですが、sdfというファイル形式があります。ごく一部のニッチな世界でしか使われていないような気がしますが、筆者は毎日扱うファイル形式です。sdfの説明は、もうchem-stationに丸投げしますね。 www.chem-station.com 私は化合物を作る方が専門なので…