f-stack/dpdk/drivers/ml/cnxk/mvtvm_ml_model.h

/* SPDX-License-Identifier: BSD-3-Clause
 * Copyright (c) 2023 Marvell.
 */

#ifndef _MVTVM_ML_MODEL_H_
#define _MVTVM_ML_MODEL_H_

#include <tvmdp.h>

#include <rte_mldev.h>

#include "cnxk_ml_io.h"

struct cnxk_ml_dev;
struct cnxk_ml_model;
struct cnxk_ml_layer;

/* Maximum number of objects per model */
#define ML_MVTVM_MODEL_OBJECT_MAX 3

/* Objects list */
extern char mvtvm_object_list[ML_MVTVM_MODEL_OBJECT_MAX][RTE_ML_STR_MAX];

/* Model object structure */
struct mvtvm_ml_model_object {
	/* Name */
	char name[RTE_ML_STR_MAX];

	/* Temporary buffer */
	uint8_t *buffer;

	/* Buffer size */
	int64_t size;
};

/* Model fast-path stats */
struct mvtvm_ml_model_xstats {
	/* Total TVM runtime latency, sum of all inferences */
	uint64_t tvm_rt_latency_tot;

	/* TVM runtime latency */
	uint64_t tvm_rt_latency;

	/* Minimum TVM runtime latency */
	uint64_t tvm_rt_latency_min;

	/* Maximum TVM runtime latency */
	uint64_t tvm_rt_latency_max;

	/* Total jobs dequeued */
	uint64_t dequeued_count;

	/* Hardware stats reset index */
	uint64_t tvm_rt_reset_count;
};

struct mvtvm_ml_model_data {
	/* Model metadata */
	struct tvmdp_model_metadata metadata;

	/* Model objects */
	struct tvmdp_model_object object;

	/* TVM runtime callbacks */
	struct tvmrt_glow_callback cb;

	/* Model I/O info */
	struct cnxk_ml_io_info info;

	/* Stats for burst ops */
	struct mvtvm_ml_model_xstats *burst_xstats;

	/* Input Tensor */
	DLTensor input_tensor[ML_CNXK_MODEL_MAX_INPUT_OUTPUT];

	/* Output Tensor */
	DLTensor output_tensor[ML_CNXK_MODEL_MAX_INPUT_OUTPUT];
};

enum cnxk_ml_model_type mvtvm_ml_model_type_get(struct rte_ml_model_params *params);
int mvtvm_ml_model_blob_parse(struct rte_ml_model_params *params,
			      struct mvtvm_ml_model_object *object);
int mvtvm_ml_model_get_layer_id(struct cnxk_ml_model *model, const char *layer_name,
				uint16_t *layer_id);
void mvtvm_ml_model_io_info_set(struct cnxk_ml_model *model);
struct cnxk_ml_io_info *mvtvm_ml_model_io_info_get(struct cnxk_ml_model *model, uint16_t layer_id);
void mvtvm_ml_model_info_set(struct cnxk_ml_dev *cnxk_mldev, struct cnxk_ml_model *model);
void mvtvm_ml_layer_print(struct cnxk_ml_dev *cnxk_mldev, struct cnxk_ml_layer *layer, FILE *fp);

#endif /* _MVTVM_ML_MODEL_H_ */
DPDK: Upgrade to 23.11.3. 2025-01-10 11:50:43 +00:00			`/* SPDX-License-Identifier: BSD-3-Clause`
			`* Copyright (c) 2023 Marvell.`
			`*/`

			`#ifndef _MVTVM_ML_MODEL_H_`
			`#define _MVTVM_ML_MODEL_H_`

			`#include <tvmdp.h>`

			`#include <rte_mldev.h>`

			`#include "cnxk_ml_io.h"`

			`struct cnxk_ml_dev;`
			`struct cnxk_ml_model;`
			`struct cnxk_ml_layer;`

			`/* Maximum number of objects per model */`
			`#define ML_MVTVM_MODEL_OBJECT_MAX 3`

			`/* Objects list */`
			`extern char mvtvm_object_list[ML_MVTVM_MODEL_OBJECT_MAX][RTE_ML_STR_MAX];`

			`/* Model object structure */`
			`struct mvtvm_ml_model_object {`
			`/* Name */`
			`char name[RTE_ML_STR_MAX];`

			`/* Temporary buffer */`
			`uint8_t *buffer;`

			`/* Buffer size */`
			`int64_t size;`
			`};`

			`/* Model fast-path stats */`
			`struct mvtvm_ml_model_xstats {`
			`/* Total TVM runtime latency, sum of all inferences */`
			`uint64_t tvm_rt_latency_tot;`

			`/* TVM runtime latency */`
			`uint64_t tvm_rt_latency;`

			`/* Minimum TVM runtime latency */`
			`uint64_t tvm_rt_latency_min;`

			`/* Maximum TVM runtime latency */`
			`uint64_t tvm_rt_latency_max;`

			`/* Total jobs dequeued */`
			`uint64_t dequeued_count;`

			`/* Hardware stats reset index */`
			`uint64_t tvm_rt_reset_count;`
			`};`

			`struct mvtvm_ml_model_data {`
			`/* Model metadata */`
			`struct tvmdp_model_metadata metadata;`

			`/* Model objects */`
			`struct tvmdp_model_object object;`

			`/* TVM runtime callbacks */`
			`struct tvmrt_glow_callback cb;`

			`/* Model I/O info */`
			`struct cnxk_ml_io_info info;`

			`/* Stats for burst ops */`
			`struct mvtvm_ml_model_xstats *burst_xstats;`

			`/* Input Tensor */`
			`DLTensor input_tensor[ML_CNXK_MODEL_MAX_INPUT_OUTPUT];`

			`/* Output Tensor */`
			`DLTensor output_tensor[ML_CNXK_MODEL_MAX_INPUT_OUTPUT];`
			`};`

			`enum cnxk_ml_model_type mvtvm_ml_model_type_get(struct rte_ml_model_params *params);`
			`int mvtvm_ml_model_blob_parse(struct rte_ml_model_params *params,`
			`struct mvtvm_ml_model_object *object);`
			`int mvtvm_ml_model_get_layer_id(struct cnxk_ml_model model, const char layer_name,`
			`uint16_t *layer_id);`
			`void mvtvm_ml_model_io_info_set(struct cnxk_ml_model *model);`
			`struct cnxk_ml_io_info mvtvm_ml_model_io_info_get(struct cnxk_ml_model model, uint16_t layer_id);`
			`void mvtvm_ml_model_info_set(struct cnxk_ml_dev cnxk_mldev, struct cnxk_ml_model model);`
			`void mvtvm_ml_layer_print(struct cnxk_ml_dev cnxk_mldev, struct cnxk_ml_layer layer, FILE *fp);`

			`#endif /* _MVTVM_ML_MODEL_H_ */`