i've used beautiful soup in python and i've done some regex-fu too let me know what you need and i can help out!<br clear="all"><br>nick<br><br>
<br><br><div class="gmail_quote">On Sat, Mar 3, 2012 at 5:49 PM, Liz Henry <span dir="ltr"><<a href="mailto:liz@bookmaniac.org">liz@bookmaniac.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Take a look at ScraperWiki - it might be useful!<br>
<br>
- liz<br>
<div class="HOEnZb"><div class="h5"><br>
On 3/3/12 11:43 AM, Ben Kochie wrote:<br>
> I've spent some time digging around for open source tools for<br>
> accessing PG&E data.  It looks like there is no API or anything useful<br>
> for getting access to the data.  We'll have to write a web scraper to<br>
> pull the data.  Since this isn't something I'm good at, I'm looking<br>
> for some help.  From what I can tell it shouldn't be terribly hard to<br>
> grab the data we need and then feed it into a database.<br>
> _______________________________________________<br>
> Noisebridge-discuss mailing list<br>
> <a href="mailto:Noisebridge-discuss@lists.noisebridge.net">Noisebridge-discuss@lists.noisebridge.net</a><br>
> <a href="https://www.noisebridge.net/mailman/listinfo/noisebridge-discuss" target="_blank">https://www.noisebridge.net/mailman/listinfo/noisebridge-discuss</a><br>
><br>
<br>
<br>
</div></div><span class="HOEnZb"><font color="#888888">--<br>
<br>
------------------------<br>
Liz Henry<br>
<a href="mailto:liz@bookmaniac.org">liz@bookmaniac.org</a><br>
<a href="http://bookmaniac.org" target="_blank">http://bookmaniac.org</a><br>
<br>
"Without models, it's hard to work; without a context, difficult to<br>
evaluate; without peers, nearly impossible to speak." -- Joanna Russ<br>
</font></span><div class="HOEnZb"><div class="h5">_______________________________________________<br>
Noisebridge-discuss mailing list<br>
<a href="mailto:Noisebridge-discuss@lists.noisebridge.net">Noisebridge-discuss@lists.noisebridge.net</a><br>
<a href="https://www.noisebridge.net/mailman/listinfo/noisebridge-discuss" target="_blank">https://www.noisebridge.net/mailman/listinfo/noisebridge-discuss</a><br>
</div></div></blockquote></div><br>