<div dir="ltr">Hi Somesh,<div><br></div><div>In that case I suppose what we'd like to see in the application is what you think the main goals of this project should be, and how you want to get there. It's not immediately obvious how that paper builds into a just-scraping project, but of course we're open to modifying the project or even an entirely new idea, especially if it's connected to earlier research.</div><div><br></div><div>I would encourage you to try out cclib a bit in practice - try parsing some logfiles, try looking for some online and parsing those. For scraping itself, there are a lot of non-compchem tools out there that can be used, and any demo code you can put together during the application period would also be an advantage. There are also many compchem databases and repositories already online, so it's also important how those would fit into a crawler/scraper ecosystem.</div><div><br></div><div>I would also encourage you to look around at the other OpenChemistry projects for a while, you might find some more projects that look interesting to you.</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Feb 20, 2018 at 7:13 AM, Somesh Mohapatra <span dir="ltr"><<a href="mailto:pikulsomesh@gmail.com" target="_blank">pikulsomesh@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="auto"><div><div dir="auto">Apart from enlisting, we can also go on similar lines as the following paper -</div><div dir="auto"><br></div><a href="https://www.nature.com/articles/s41524-017-0055-6" target="_blank">https://www.nature.com/<wbr>articles/s41524-017-0055-6</a><div dir="auto"><br></div><div dir="auto">This work is by the lab I am looking forward to join at MIT, so that makes the GSoC project a hands on experience prior to starting there.</div><span class="HOEnZb"><font color="#888888"><div dir="auto"><br></div><div dir="auto">Somesh.</div></font></span><div><div class="h5"><br><div class="gmail_extra"><br><div class="gmail_quote">On Feb 20, 2018 8:39 PM, "Somesh Mohapatra" <<a href="mailto:pikulsomesh@gmail.com" target="_blank">pikulsomesh@gmail.com</a>> wrote:<br type="attribution"><blockquote class="m_3737972320421704122quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="auto"><div>Hi Karol</div><div dir="auto"><br></div><div dir="auto">Yes, that is the one. </div><font color="#888888"><div dir="auto"><br></div></font><div dir="auto"><font color="#888888">Somesh.</font><div class="m_3737972320421704122elided-text"><br><div class="gmail_extra" dir="auto"><br><div class="gmail_quote">On Feb 20, 2018 8:36 PM, "Karol Langner" <<a href="mailto:karol.langner@gmail.com" target="_blank">karol.langner@gmail.com</a>> wrote:<br type="attribution"><blockquote class="m_3737972320421704122m_4883285093902127357quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Hi Somesh,<div><br></div><div>Nice to hear from you. Which project is the "content enlisting project"? Do you mean the cclib web scraper?</div><font color="#888888"><div><br></div><div>- Karol</div></font></div><div class="m_3737972320421704122m_4883285093902127357elided-text"><div class="gmail_extra"><br><div class="gmail_quote">On Sun, Feb 18, 2018 at 2:09 AM, Somesh Mohapatra <span dir="ltr"><<a href="mailto:pikulsomesh@gmail.com" target="_blank">pikulsomesh@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Dear Karol<div><br></div><div><div>I have recently been accepted to MIT for PhD in Materials Science, and looking forward to be a part of GSoC over the Summer of 2018. I have earlier worked on Computational Materials Science and simulations for my projects (Resume, attached), and then on Bioinformatics and Computational Biology.</div><div><br></div><div>I am looking forward to hone my coding skills and contribute to the Computational Chemistry content enlisting project. I am open to understanding other projects as well, if you see that based on my skillset, I would be a better fit in another work.</div><div><br></div><div>Looking forward to discuss more on the possibilities!</div><span class="m_3737972320421704122m_4883285093902127357m_-1450800321256616537HOEnZb"><font color="#888888"><div><div class="m_3737972320421704122m_4883285093902127357m_-1450800321256616537m_8066752852659216661gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div lang="en-IN"><div dir="ltr"><div style="font-size:small" lang="en-IN"><div lang="en-IN"><font color="#000000"><br>Somesh Mohapatra</font></div><div lang="en-IN"><font color="#000000">Graduate Student </font><span style="color:rgb(0,0,0)">(Fall 18)</span></div><div lang="en-IN"><font color="#000000">Department of Materials Science and Engineering</font></div><div lang="en-IN"><font color="#000000">Massachusetts Institute of Technology</font></div><div lang="en-IN"><font color="#000000"><div lang="en-IN">Contact - +91 7060 33 45 66</div><div lang="en-IN">E-Mail - <a href="mailto:pikulsomesh@gmail.com" target="_blank">pikulsomesh@gmail.com</a></div><div lang="en-IN">Website - <a href="http://someshmohapatra.in" target="_blank">someshmohapatra.in</a></div></font></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div>
</font></span></div></div><span class="m_3737972320421704122m_4883285093902127357m_-1450800321256616537HOEnZb"><font color="#888888"><div hspace="streak-pt-mark" style="max-height:1px"><img alt="" style="width:0px;max-height:0px;overflow:hidden" src="https://mailfoogae.appspot.com/t?sender=acGlrdWxzb21lc2hAZ21haWwuY29t&type=zerocontent&guid=5c358266-b55f-4d7c-8c8b-047123bbed0b"><font color="#ffffff" size="1">ᐧ</font></div>
</font></span></blockquote></div><br></div>
</div></blockquote></div><br></div></div></div></div>
</blockquote></div><br></div></div></div></div></div>
</blockquote></div><br></div>