Merge pull request #45672 from reduz/barrier-optimization

Rewrote how barriers work for faster rendering
author: Rémi Verschelde <remi@verschelde.fr> 2021-02-04 17:19:35 +0100
committer: GitHub <noreply@github.com> 2021-02-04 17:19:35 +0100
commit: 2ba66c1457850fa0eb6e1c8d144e311d2b59619a (patch)
tree: 56948448bed54f75ef4bee8e7a50faea464a68c8 /servers/rendering/renderer_rd/shader_rd.cpp
parent: a405a249a60fc6b88b0c2880d85dc6dc9c1d3e10 (diff)
parent: f20999f6feba2af6ae7d246c40fcfc5404bdd429 (diff)
1 files changed, 18 insertions, 1 deletions
diff --git a/servers/rendering/renderer_rd/shader_rd.cpp b/servers/rendering/renderer_rd/shader_rd.cpp
index 2ae22a8a38..e4a39ff813 100644
--- a/servers/rendering/renderer_rd/shader_rd.cpp
+++ b/servers/rendering/renderer_rd/shader_rd.cpp
@@ -301,6 +301,7 @@ void ShaderRD::_compile_variant(uint32_t p_variant, Version *p_version) {
 
 		builder.append(compute_codev.get_data()); // version info (if exists)
 		builder.append("\n"); //make sure defines begin at newline
+		builder.append(base_compute_defines.get_data());
 		builder.append(general_defines.get_data());
 		builder.append(variant_defines[p_variant].get_data());
 
@@ -401,7 +402,6 @@ RS::ShaderNativeSourceCode ShaderRD::version_get_native_source_code(RID p_versio
 
 			builder.append(fragment_codev.get_data()); // version info (if exists)
 			builder.append("\n"); //make sure defines begin at newline
-
 			builder.append(general_defines.get_data());
 			builder.append(variant_defines[i].get_data());
 			for (int j = 0; j < version->custom_defines.size(); j++) {
@@ -440,6 +440,7 @@ RS::ShaderNativeSourceCode ShaderRD::version_get_native_source_code(RID p_versio
 
 			builder.append(compute_codev.get_data()); // version info (if exists)
 			builder.append("\n"); //make sure defines begin at newline
+			builder.append(base_compute_defines.get_data());
 			builder.append(general_defines.get_data());
 			builder.append(variant_defines[i].get_data());
 
@@ -596,6 +597,22 @@ bool ShaderRD::is_variant_enabled(int p_variant) const {
 	return variants_enabled[p_variant];
 }
 
+ShaderRD::ShaderRD() {
+	// Do not feel forced to use this, in most cases it makes little to no difference.
+	bool use_32_threads = false;
+	if (RD::get_singleton()->get_device_vendor_name() == "NVIDIA") {
+		use_32_threads = true;
+	}
+	String base_compute_define_text;
+	if (use_32_threads) {
+		base_compute_define_text = "\n#define NATIVE_LOCAL_GROUP_SIZE 32\n#define NATIVE_LOCAL_SIZE_2D_X 8\n#define NATIVE_LOCAL_SIZE_2D_Y 4\n";
+	} else {
+		base_compute_define_text = "\n#define NATIVE_LOCAL_GROUP_SIZE 64\n#define NATIVE_LOCAL_SIZE_2D_X 8\n#define NATIVE_LOCAL_SIZE_2D_Y 8\n";
+	}
+
+	base_compute_defines = base_compute_define_text.ascii();
+}
+
 void ShaderRD::initialize(const Vector<String> &p_variant_defines, const String &p_general_defines) {
 	ERR_FAIL_COND(variant_defines.size());
 	ERR_FAIL_COND(p_variant_defines.size() == 0);
author	Rémi Verschelde <remi@verschelde.fr>	2021-02-04 17:19:35 +0100
committer	GitHub <noreply@github.com>	2021-02-04 17:19:35 +0100
commit	2ba66c1457850fa0eb6e1c8d144e311d2b59619a (patch)
tree	56948448bed54f75ef4bee8e7a50faea464a68c8 /servers/rendering/renderer_rd/shader_rd.cpp
parent	a405a249a60fc6b88b0c2880d85dc6dc9c1d3e10 (diff)
parent	f20999f6feba2af6ae7d246c40fcfc5404bdd429 (diff)