列举一些遇到的比较难以回答的research相关的问题。
回答这些问题要借鉴一些文科考试的思路,一句话的问题并不是说让你也一句话就说清楚,而是可能需要用一大段,从几个点去回答。因为这些问题让人感到难以回答的原因是,一个问题实际上是包含着好几个具体的小问题的。在回答之前没有想清楚从哪几个角度去回答,然后就直接回答很具体的内容,往往就容易回答不好。
某个领域(比如in situ workflow)在国内国外的主要挑战有哪些。
这个问题是之前的一次面试中被问到的,回答的有亮点还是比较难的,答案不能太朴实了,要让人觉得有高度。
我的原本的,凭直觉的答案大致是:
1 in stu 本身已经有了十多年的研究历史,很多方案已经成熟,在一些比较好的杂志上关于in situ的主题逐渐减少。
2 如何与新的方法结合是比较重要的挑战。
3 如何让这些方法或者解决方案能在更广泛的场景下(脱离了已有的场景)发挥作用是比较大的挑战。
4 在国内的话可能如何利用新的加速器是一个比较大的挑战。
这些说的大致都没错,但后来评委老师反馈,这个回答给老师们留下的映像不是太好,比如第一个说的,有一种让自己说的泄了气的感觉。老师问得抽象,你的回答就应该具体一些,这里的问题就是回答的太过于抽象,缺乏一些具体的信息。
这是一个改进的版本:
(motivation) In situ 的动机是为了环节计算带宽和存储带宽的不均衡问题,数据量越来越多,存储和传输带宽的差别越来越大,in situ的解决方案的需求是长期存在的。归根结底是数据产生的能力小于数据传输和数据分析的能力。
(当前进展) 对于in situ的解决方案而言,已经有了十多年的研究历史,相关的研究围绕着硬件的升级不断更新,比如从P级机器到E级机器。
(更近一步细节) 具体在科学可视化或者科学工作流中,研究的点就是如何将in situ与data reduction, visualization, transfer 结合起来。共同的挑战是如何将这些技术适用到新的硬件上,以及如何将这些技术应用到新的模拟和数据上 (比如warpx的工作,比如puncare map开发的新的应用),如何利用新的方法来提升原位可视化工作流的灵活性和效率。
(针对国内国外的特点) 1 国内的地方一个是如何与自己的硬件进行适配,这些已有的解决方案如何能适配到国内的硬件上,2 另一个是针对特定的应用研究新的解决方案,以及有自主知识产权的通用的相关的解决方案,目前看到的可视化,数据压缩,传输的方案好多都是国外实验室架构和维护的。3 再一个是比如针对我们自己的大型科学装置,数据传输,可视化,以及数据压缩的方案如何有效地应用起来辅助科学发现(适配自己的大科学装置,满足其中的一些要求),这个是国内的in situ研究面临的挑战。
当前的这个工作中,妨碍/限制scalabiity的根本原因是什么。
这个问题是读博士期间,老师经常问到的一个问题。
这个工作使用了GPU或者其他的加速器,这种性能的提升是仅仅因为使用了GPU还是说在算法本身上有一些提升或贡献。
这个问题其实是二个问题
把已有的问题/算法,用基于GPU的加速器实现,有什么困难的地方或者值得挑战的地方。
对于使用了加速器或者GPU的实现,这种实现是否在算法上是有效的,比同样类型的基于GPU的实现快多少,瓶颈在哪里,是否有一些可以进一步优化的空间,测试过程中多大程度上接近理论值 (并行计算上的理论值,以及计算机本身的理论峰值)
This is hard one, 首先是从算法上,根据阿姆达law,引入并行能给整个程序带来多多大程度的提升,这个是有理论上限的。如果本身算法就是 Embarrassingly parallel (perfect parallel) 然后其中并没有多少depedency的话,可能就不是一个major research contribution 或者从research的角度上看是没有多少需要contribute的地方的。
另一个是从已经构建的层面,当前使用到的解决方案是否能很高效地利用GPU,比如能达到百分之多少的GPU theoretical peak performance这个是在evaluation的时候应该加上的内容。
这一系列内容都是用来分析算法在GPU上执行的效果的文章。
关于theoretical peak floting point performace (GFLOPS) 这里 有比较详细的解释
这个 vedio也解释的比较好, for non-bentch mark program, we do not know how much flopes it is operted, since it is not a matrix multiplication program.
关于GPU usesge的含义
https://arthurchiao.art/blog/understanding-gpu-performance/#24-the-use-methodology
这个文章讲得很好。
这个文章 讲了peak performance的事情。
这个里面也有一些讲解