<div dir="ltr">A flatfile of anonymized log fields would go better with my cut | sort | uniq -c | gnuplot toolchain.<div><br></div><div style>--S</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Fri, Jun 21, 2013 at 1:19 PM, Leif Ryge <span dir="ltr"><<a href="mailto:leif@synthesize.us" target="_blank">leif@synthesize.us</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im">On Fri, Jun 21, 2013 at 11:58:01AM -0700, Shannon Lee wrote:<br>
> No, if you generate a one-time pad of random hashes, such that...<br>
><br>
> 1 -> foo<br>
> 2 -> bargain basement<br>
> 3 -> mickey mouse<br>
> 4 -> jet plane<br>
><br>
> ...et cetera, then we maintain frequency counts and timing while<br>
> anonymizing specific codes, and you can't brute force it because there's no<br>
> hash function.  You can even throw away the one-time pad, because the<br>
> timing data makes it easy to map "mickey mouse" back to specific entries if<br>
> you have the original dataset.<br>
><br>
> I think Curtis' suggestion actually has the same properties.<br>
><br>
> --S<br>
<br>
</div>I was talking about making pseudonymous (not anonymous!) door code logs<br>
public a few months ago, and started on a project to do so. I'm sorry I<br>
haven't finished it yet, and glad to see others interested in doing this<br>
now!<br>
<br>
(Previosuly I heard a few concerns which I think I addressed, but mostly<br>
a lot of meh.)<br>
<br>
My plan was/is to replace the flat file of codes + comments (which<br>
frequently have email addresses which obviously should not be made<br>
public) with a json file that has a 3rd field called "nickname" that<br>
users can optionally choose, knowing that it will be publicly logged.<br>
The nicknames can be randomly chosen initially.<br>
<br>
I began implementing that here:<br>
<a href="https://github.com/noisebridge/noisebridge-baron/compare/master...json" target="_blank">https://github.com/noisebridge/noisebridge-baron/compare/master...json</a><br>
<br>
The converter script works, but has boring names ("pseudonym 751dfb0"),<br>
and I have not tested the changes to baron.py yet.<br>
<br>
I was thinking of trying to generate pronounceable gibberish names, but<br>
haven't done that part yet.<br>
<br>
I am not going to have time to work on this today or tomorrow but this<br>
thread inspiried me to push the little bit of code I wrote so far in<br>
case someone might find it useful.<br>
<br>
If nobody else publishes something by Sunday, I'll probably work on this<br>
then.<br>
<span class="HOEnZb"><font color="#888888"><br>
~leif<br>
<br>
</font></span></blockquote></div><br><br clear="all"><div><br></div>-- <br>Shannon Lee<br>(503) 539-3700<br><br>"Any sufficiently analyzed magic is indistinguishable from science."
</div>