<html><head><meta http-equiv="Content-Type" content="text/html charset=us-ascii"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class=""><div class="">Hi Kunal,</div><div class=""><br class=""></div><div class="">Thanks for your message. I think Adam and/or Karol can comment more, but I'll give some in-line comments to your message.</div><br class=""><div><blockquote type="cite" class=""><div class=""><b class="">1. Machine Learning applied to parsing computational chemistry output: </b>Since parser is used to get a very specific output from a specific input, what is it that we expect from the final ML pipeline. Do we want it to get all the available data from an output file (like most </div><div class=""><div dir="ltr" class=""><div class="">(if not all) of the parameters mentioned in data.py)?</div></div></div></blockquote><div><br class=""></div><div><br class=""></div><div>Right. The question is whether it's possible to teach a ML model to find all available data mentioned in data.py. This is clearly more of a research project than some of the other ideas.</div><div><br class=""></div><br class=""><blockquote type="cite" class=""><div class=""><div dir="ltr" class=""><div class=""><h3 style="background-image:none;background-position:initial;background-size:initial;background-repeat:initial;background-origin:initial;background-clip:initial;margin:0.3em 0px 0px;overflow:hidden;padding-top:0.5em;padding-bottom:0px;border-bottom:none;line-height:1.6" class=""><font size="2" class="">2. Refactoring parser and Implementing new parsers: <span style="font-weight:normal" class="">I was looking into this and saw that you thought about an approach which utilized decorators and partial parsing of the file, but maybe it was dropped? Also, can you please provide a list of the parsers you would like to extend in cclib in this GSoC ...</span></font></h3></div></div></div></blockquote><div><br class=""></div><div>There are a lot of example files in the cclib data repository: </div><div><a href="https://github.com/cclib/cclib-data" class="">https://github.com/cclib/cclib-data</a></div><div><br class=""></div><div>I think the idea here is that you would choose which parsers you'd want to refactor and/or add. There are, after all, no end to the number of computational packages.</div><div><br class=""></div><br class=""><blockquote type="cite" class=""><div class=""><div dir="ltr" class=""><div class=""><b class="">I was thinking that given the overall duration of GSoC I would like to attempt to do more than one project (Combining two projects). What are your thoughts on this? Given the duration, would it be possible?</b><br class=""></div></div></div></blockquote><br class=""></div><div><br class=""></div><div>It depends a bit on the projects, but I can imagine these two projects could be blended (e.g., refactoring and adding new parsers while trying the ML approach).</div><div><br class=""></div><div>As for the application, here's a guide on the wiki:</div><div><a href="https://github.com/cclib/cclib-data" class="">https://github.com/cclib/cclib-data</a></div><div><br class=""></div><div>We usually recommend students start a proposal with Google Docs (or something similar) and share with mentors/admins to get feedback.</div><div><br class=""></div><div>Hope that helps,</div><div>-Geoff</div><br class=""></body></html>