Hey everyone!<br><br>Just got back the other day and looking forward to meeting up Wednesday<br>and hearing about Hadoop. I just read a bit through the KDD challenge, and<br>was wondering if I could help out by doing something involving neural nets?<br>
<br>Neural nets can be made good at generalization and prediction, and also<br>reducing problem dimensionality by clustering. For example, we could<br>cluster the input records into groups, and pass that group data into an SVM<br>
or something. Or we could use some sort of dimensionality reducing network<br>and pass the dimensionally-reduced dataset to a bayesian learner (which<br>wouldn't work well if the data was high dimensional).<br><br>If someone was already thinking of doing this I'd be happy to help out, can't<br>
glean much of what happened from the meeting notes.<br><br>See you Wednesday!<br><br>  mike<br><br><br><br><div class="gmail_quote">On Wed, May 12, 2010 at 10:05 PM, Thomas Lotze <span dir="ltr"><<a href="mailto:thomas.lotze@gmail.com">thomas.lotze@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">Hello, all!  There was a good meeting today where we talked about the KDD dataset and plans for the next steps.  I think it'll be a really good opportunity for learning new tools and methods on machine learning, trading knowledge and upping our collective ability!  We've got plans to look at R, libsvm, weka, and Hadoop to tackle the problem.  I'm excited about working with it, and anyone else who wants to get involved should email me, download the data, and take a look at the wiki page I've put our initial plans in:<br>

<br><a href="https://www.noisebridge.net/wiki/KDD_Competition_2010" target="_blank">https://www.noisebridge.net/wiki/KDD_Competition_2010</a><br><br><br>Next week, Vikarem will be presenting Hadoop, with some scripts and tools to actually use it -- I think we're all aware of how important Hadoop already is and will continue to be in the future for analyzing large data sets, so I'm really glad that we've now got someone who knows about it and is willing to tell us more!  I think this is a really great opportunity, and many thanks to Vikarem for presenting!<br>

<br><br>Best wishes,<br><font color="#888888">Thomas<br>
</font><br>_______________________________________________<br>
ml mailing list<br>
<a href="mailto:ml@lists.noisebridge.net">ml@lists.noisebridge.net</a><br>
<a href="https://www.noisebridge.net/mailman/listinfo/ml" target="_blank">https://www.noisebridge.net/mailman/listinfo/ml</a><br>
<br></blockquote></div><br>