読者です 読者をやめる 読者になる 読者になる

今川館

都内勤務の地味OLです

イテレータは前に突き進む

http://d.hatena.ne.jp/imagawa_yakata/20120104/1325703433 このネタなのですが、id:yanolabさんが別の解答を書かれています。map_between をやってみる -slice使ったっていいじゃない編- - yanolabの日記 from itertools import islice, imap imap(func, i…

イテレータって何?

iter関数にリストを渡すとリストはコピーされないの? 昨日書いた↓この記事を見たtell-kがコメントをつけてくれました。 http://d.hatena.ne.jp/imagawa_yakata/20120104/1325703433 > itr = iter(lst)これってイテレータオブジェクトになったコピーが返って…

リストの隣接要素を次々に処理する

map_between をやってみる - Study08.net 対シンバシ殲滅用人型機動兵器 こういう記事があって、リストの隣接する要素を次々に処理する高階関数を作る話のようです。期待する挙動としては、こんな感じです。 >>> map_between(lambda x, y: x + y, [1, 2, 3, …

かけ算演算子の挙動を定義する -- Pythonの特殊メソッド

かけ算に順番が必要?必要ではない? かけ算に順番が必要である・必要ではない という話が世間では話題になっているようです。かけ算の5×3と3×5って違うの? - Togetterまとめ そういえば掛け算にはそんなルールがあったなTwitterのタイムラインでも上記の話…

re.subにはcallableなオブジェクトを渡せる

python-mini-hackathonで教えてもらった。 知らなかった。以下、例を殴り書き。 import re def main(): text = """ name = %NAME% age = %AGE% location = %LOCATION% """ pattern = r"%([A-Z]+)%" values = { "NAME" : "easy", "AGE" : "13", } def fn(matc…

python-dateutilの使い方

pythonの日付処理モジュールとしてdatetimeパッケージがあるが、dateutilパッケージのモジュールがもっと色々面倒を見てくれるのでちょっと調べてみた。 dateutilがやってくれること 沢山あるけど以下、わたしが使いたいと思った機能を抜粋。 月末を算出して…

grepに-rオプションがあることを今日知った

今までずっとfindとxargsを使っていた 今まで、特定のディレクトリを再帰的に辿って指定したパターンにマッチする文字列を含むファイルを探すときはfindとxargsを使っていた。例えば、カレントディレクトリ以下を辿って"Linux"という文字列を含むファイルを…

enumerateの代わりにitertoolsを使ってみる

itertoolsのについてメモ -- 似非言語オタクの戯言 http://d.hatena.ne.jp/aitahoge/20110517/1305611498この記事を読んでいて気づいたこと。 count(start=0, step=1) 名前のとおり、next()が呼び出される度にカウントされる。 izip()との併用とか、enumerat…

テストデータ作成のヒント: 「タプル記法」のすすめ

テストデータをどうやって作りますか? テストコードを書くとき、テストデータを投入することが多いと思うが、普段皆さんはどうやってテストデータを作っているのだろう。例えばDjangoは所定のモデルのデータをjsonやxml形式で出力して利用するfixtureという…

マルチバイト文字を含む正規表現のパターンを定義するときはunicodeでパターンを書かないと予期せぬ結果をもたらす

adminuser.pyを書いていたときにはまったのがこの問題。 reモジュールを使って半角と全角のスペースで文字列をsplitしようとしたのだが、 正規表現パターンをstrで渡してしまいおかしな文字列分割が行われてはまった。 regex1 = re.compile(r"[ ]+") regex2 …

pythonのunittestで例外の送出を検証する場合はassertRaises

pythonのunittest.TestCaseで例外の送出を検証したいときは TestCase.assertRaises TestCase.failUnlessRaises でやる。 試しに上記メソッドで検証した場合と独自にそれっぽい検証メソッドを定義した場合を比較してみる。 # -*- coding:utf-8 -*- import uni…

minimockの使い方

pythonのモックとしてminimockというライブラリがある。 日本語のドキュメント・ブログが見当たらないので使い方をここに書いておく。 minimockを構成するモジュール mock関数 -- モックを当てる。 restore関数 -- 当てたモックを解除する。 Mockクラス -- m…

Unicodeの「横棒」文字

[日本語の横棒記号に絶望した] http://taichino.com/programming/1384[従来の文字コードとUnicodeの対応に関する諸問題] http://euc.jp/i18n/ucsnote.ja.html ↑Unicodeでは横棒文字がたくさん定義されている。 しかし、人が画面に入力する横棒なんて、見た目…

続:文字列リテラルは連続させられる

http://d.hatena.ne.jp/imagawa_yakata/20091120/1258698626↑これの続き。文字列リテラルを連続させて一つの文字列リテラルを作る場合、すべてリテラルで記述しなければならない。 変数を混ぜると構文エラーになる。 s = ( r'^[' r'abcXYZ' r']+$' ) print s…

MySQLdb カーソルをN件ずつフェッチする

↓ここを参考。 Django(正確にはMySQLdb)をつかってMySQLの巨大な結果を返すselect文を処理する http://d.hatena.ne.jp/shohu33/20091122↓こちらも。 http://www.ueblog.org/blog/entry/pythonmysqldb/ MySQLdbで大量のレコードをSELECTする場合、 cursor.exe…

MySQLdb SQL文のエスケープ

MySQLdbでcursor.executeをしたときに%sの可変部分をどう処理しているのか調べた。 どうも、connection.literalというメソッドがあるようだ。 [MySQL-python-1.2.3c1/MySQLdb/cursors.py] def execute(self, query, args=None): ''' 中略 ''' if args is not…

文字列リテラルは連続させられる

これは知らなかった。 文字列リテラルは連続させると一つにつながる。 例えば、 >>> print ('foo' ... 'bar' ... 'baz') foobarbaz↑このようになる。 (括弧はリテラル3個をひとまとめの評価にする為で、カンマで区切ってタプルにしてはいけない)三連クォー…