……
6月30日晚上,林灰还去见了尹芙·卡莉一面。
怎么说呢,尹芙·卡莉所从事的跟进工作有一定的进展,但进展并没有想象中的那么大。
至少跟林灰预期的有落差。
当然林灰知道这事也急不得。
一般来说研究一个以生成式文本摘要为内核的高效摘要应用需要的时间往往要受到很多因素制约:
首先是技术水平方面:
开发者的技术水平和经验将影响项目开发的进度和质量。
如果开发者有较为丰富的自然语言处理和机器学习经验,
那么开发一个高效的生成式文本摘要应用的时间可能会更短。
其次是需求分析方面:
需求分析要明确,对用户需求的精准分析同时明确对摘要应用的目标,将对开发的时间和资源投入产生影响。
如果需求分析不清晰,可能需要耗费更多的时间来重构和修改代码。
其次涉及到数据集和算法选择方面:
构建生成式文本摘要应用需要选择合适的数据集和算法。
数据集和算法这将决定摘要的质量和效率。
选择合适的数据集和算法将有助于少走弯路。
而一旦数据集较大或算法复杂,需要进行模型训练和优化,开发时间可能会更长。
尤其是涉及到机器学习这方面的算法。
通常表现是算法里面还有算法。
或者说复杂的算法可以分解成多个较为简单的算法。
这些简单的算法可以组合在一起完成更复杂的计算任务。
并非仅仅是自然语言处理这个方向会遇到这种情况。
据林灰所知,很多机器学习的算法方面都会有类似的情况。
例如,在计算机视觉领域,图像处理算法通常会由多个子算法组成,每个子算法负责不同的任务,例如边缘检测、特征提取、目标检测等。这些子算法可以组合在一起,形成一个完整的图像处理算法。
另一个例子是在机器学习领域中,通常需要将原始数据集分解成多个子数据集,并对每个子数据集进行特征提取和模型训练等处理。这些处理过程中使用的算法也可以看作是子算法,它们组合在一起,形成了一个完整的机器学习模型。
类似的例子还有很多。
可以说在大型计算任务中这种现象很常见:
——复杂的算法被分解成多个子算法,这些子算法可以使用不同的计算技术和算法来实现从而协同完成更复杂的任务。
之所以采用这种拆分组合主要是为了提高计算效率,简化开发过程,并使得算法的维护和扩展更加容易。
除了数据集和算法这方面,
再者还涉及到资源投入这方面:
构建一个高效的生成式文本摘要应用需要投入足够的人力、物力和财力资源。
这可能包括招聘开发人员、购买软硬件设备等。
总体而言,构建一个以生成式文本摘要为内核的高效摘要应用需要的时间可能在数周到数月不等,具体时间取决于上述因素以及其他可能影响开发时间的因素。
事实上如果没有重生带来的种种便利,
当初开发南风app的时候林灰也会遇到很多麻烦。
也幸好重生带来的种种便利,
林灰才能有很大的施展空间。
……
说起来前世2010到2015年,其实是人工智能高速发展的一段时期。
在这段时期,许多机器学习算法和技术在这个时期得到了广泛的应用和推广,
例如深度学习、随机森林、支持向量机等。
但这些方面取得的进步相比于2020年以后更成熟的机器学习技术相比仍然还有很多欠缺的地方。
如果一个很擅长机器学习方面的技术人员带着您带着全部的记忆从2020年回到2015年以前,
其实是很容易在很多方面有所作为的。
譬如说在机器学习应用这方面:
在2015年,机器学习的应用领域还比较局限,大部分应用都集中在语音识别、推荐系统等领域。
那么一个来自于往后几年的机器学习技术人员无疑可以考虑探索更多的机器学习应用场景。
比如说智能客服、金融风控、医疗诊断等新领域,为这些领域的发展做出贡献。
再比如说,深度学习算法方面,在2015年前深度学习算法刚刚开始得到重视和应用,而且只是应用于少量领域。
如果一个后世的技术人员带着全部的记忆来到2015年前,
毫无疑问,他可以在这个时期推广和优化深度学习算法,并将其应用于更广泛的领域。