<!-- begin sanitized html -->
Dear Bálint,<div><br></div><div>Thank you for your kind reply and there is no further question.<br><br><div id="signEditor"></div>Best regards,</div><div>Wanrun Jiang<br><br><div style="FONT: 9pt 宋体">----- 回复邮件 -----<div style="BACKGROUND: #e4e4e4; font-color: black"><b>发信人:</b>Bálint Aradi <aradi@uni-bremen.de></div><div><b>收信人:</b>dftb-plus-user <dftb-plus-user@mailman.zfn.uni-bremen.de></div><div><b>时  间:</b>2017年08月01日 19时42分14秒</div><div><b>主  题:</b>Re: [DFTB-Plus-User] Running DFTB+17.1 executables in multi-threads</div></div><br><blockquote style="BORDER-RIGHT: medium none; PADDING-RIGHT: 0mm; BORDER-TOP: medium none; PADDING-LEFT: 4pt; PADDING-BOTTOM: 0mm; MARGIN: 5pt 0mm 5pt 3.75pt; BORDER-LEFT: black 1.5pt solid; PADDING-TOP: 0mm; BORDER-BOTTOM: medium none"><div class="bodyclass"><br>
Dear Wanryun,<br>
<br>
> In previous versions, export OMP_NUM_THREADS=n could be used to set <br>
> the threads (cores) but it seems not working for the 17.1. The jobs <br>
> always drop to a single-thread running though fluctuations of CPU <br>
> occupations over 1 occurs occasionally.<br>
> <br>
> Besides, in previous versions, no specification of threads will make <br>
> a job occupy all the threads of the node, but the default running of <br>
> the 17.1 version now only takes 1 thread.<br>
<br>
Now, that the DFTB+ binary can be downloaded by anybody without<br>
registration, there are some legal constraints (mainly US export<br>
restrictions) on the compiler and libraries we can use for building the<br>
public binary. This restricts us basically to open source compilers and<br>
libraries only.<br>
<br>
The public binary on the website has been compiled with GNU Fortran and<br>
linked against the OpenBLAS library. OpenBLAS is threaded and you still<br>
can use the OMP_NUM_THREADS environment variable to control the number<br>
of threads. However, the threading of the diagonalisation routines in<br>
OpenBLAS is unfortunately poor, this is why most of the time you see<br>
less load/threads than possible.<br>
<br>
As stated on the website, you can obtain a much more performant and<br>
better scaling binary, if you compile the source yourself, using Intels<br>
Fortran compiler and (even more important) by linking it against the<br>
Intel MKL library. You find an appropriate makefile in the sys/ folder,<br>
so it should be quite straightforward, provided you have access to those<br>
compilers and libraries.<br>
<br>
  Best regards,<br>
<br>
  Bálint<br>
<br>
-- <br>
Dr. Bálint Aradi<br>
Bremen Center for Computational Materials Science, University of Bremen<br>
http://www.bccms.uni-bremen.de/cms/people/b-aradi/<br>
<br>
<br>
<br>
_______________________________________________<br>
DFTB-Plus-User mailing list<br>
DFTB-Plus-User@mailman.zfn.uni-bremen.de<br>
https://mailman.zfn.uni-bremen.de/cgi-bin/mailman/listinfo/dftb-plus-user</div></blockquote>
<!-- end sanitized html -->
</div>