ノードの値を取り出すのがnodeValueだが、内容がHTMLなのでうまく取得出来ずつまずく。結論から言えば、内容部分をCDATAセクションにする事でパースさせないという手法が有効だった。自分的には発見だったのだが、まぁ、知っている人からみれば当たり前だろうなぁ…。
というか、XMLなのでHTMLタグも一応パース対象になるのは当たり前なのだ。そのまま内容に入れるのは、タグのコンフリクトなど様々な面で危険といえるだろう。名前空間で分離するか、CDATAセクションにするか…名前空間のほうがスマートかと思うが、CDATAのほうが手軽だし、今回そんなに格好良い事は言ってられないので忘れよう。