Posts by Tags

GAN

MCP

ReAct

Reinforcement Learning

deepseek-r1 论文阅度

1 minute read

Published:

DeepSeek R1 的各种亮眼成果,那它到底是怎么训练出来的呢?这背后的训练过程就像一场精心策划的冒险,每一步都至关重要,接下来咱们就一起走进这场训练之旅。

agents

deepseek

deepseek-r1 论文阅度

1 minute read

Published:

DeepSeek R1 的各种亮眼成果,那它到底是怎么训练出来的呢?这背后的训练过程就像一场精心策划的冒险,每一步都至关重要,接下来咱们就一起走进这场训练之旅。

reason

deepseek-r1 论文阅度

1 minute read

Published:

DeepSeek R1 的各种亮眼成果,那它到底是怎么训练出来的呢?这背后的训练过程就像一场精心策划的冒险,每一步都至关重要,接下来咱们就一起走进这场训练之旅。

人工智能

deepseek-r1 论文阅度

1 minute read

Published:

DeepSeek R1 的各种亮眼成果,那它到底是怎么训练出来的呢?这背后的训练过程就像一场精心策划的冒险,每一步都至关重要,接下来咱们就一起走进这场训练之旅。

大模型

deepseek-r1 论文阅度

1 minute read

Published:

DeepSeek R1 的各种亮眼成果,那它到底是怎么训练出来的呢?这背后的训练过程就像一场精心策划的冒险,每一步都至关重要,接下来咱们就一起走进这场训练之旅。

扩散模型

深度学习

生成式模型

deepseek-r1 论文阅度

1 minute read

Published:

DeepSeek R1 的各种亮眼成果,那它到底是怎么训练出来的呢?这背后的训练过程就像一场精心策划的冒险,每一步都至关重要,接下来咱们就一起走进这场训练之旅。