TurkishCyberbullying 👩🏼‍💻👨🏼‍💻

İçindekiler

Proje Açıklaması
Kullanılan Modeller
Kurulum
Sonuçlar
Ek
Katkıda Bulunma

Proje Açıklaması

Bu proje, Türkçe X (eski adıyla twitter) verileri kullanılarak oluşturulan 4 kategorili:

Nötr
Kızdırma
Irkçılık
Cinsiyetçilik

veri seti ile BERT, ConvBERT ve DistilBERT modellerinin fine-tune edilmesini ele alır. Çalışma çok sınıflı metin sınıflandırma projesidir. Çalışmada nanelimon/turkish-social-media-offensive-dataset veri seti kullanılmıştır.

Kullanılan Modeller

Çalışmada Wikipedia dökümü, çeşitli OPUS korpusları ve Kemal Oflazer tarafından sağlanan özel bir korpus üzerinde eğitilen BERTurk, ConvBERTurk, DistilBERTurk modelleri kullanılmıştır.

Kurulum

Bu projeyi yerel ortamınıza kurmak için aşağıdaki adımları izleyin:

1. Depoyu klonlayın:

git clone hhttps://github.com/BilgeNurBekar/TurkishCyberbullying.git

2. Proje dizinine gidin:

cd TurkishCyberbullying

3. Sanal ortamı oluşturun:

python -m venv ./venv

4. Sanal ortamı etkinleştirin:

Windows için:
```
.\venv\Scripts\activate
```
Unix veya MacOS için:
```
source venv/bin/activate
```

5. Gerekli bağımlılıkları yükleyin:

pip install -r requirements.txt

Sonuçlar

BERTurk

Confusion Matrix

Precision - Recall Curve (PR Curve)

Results Table

ConvBERTurk

Confusion Matrix

Precision - Recall Curve (PR Curve)

Results Table

DistilBERTurk

Confusion Matrix

Precision - Recall Curve (PR Curve)

Results Table

Ek

Çalışmada oluşturulan modelleri kullanmak, eğitmek için HuggingFace platformu üzerinden AIZinu profilindeki modelleri inceleyebilirsiniz.

Çalışmanın API' ı için FASTAPI reposunu incelemeyi unutmayın ☄️

Katkıda Bulunma

Katkıda bulunmak isterseniz, lütfen aşağıdaki adımları takip edin:

Depoyu fork edin.

Yeni bir branch oluşturun: git checkout -b feature/ozellik-adi

Değişikliklerinizi yapın ve commit edin.

Pull request açın.

Çalışmayı beğendiyseniz yıldızlamayı unutmayın ⭐️

Related Projects

pytextclassifier

pytextclassifier is a toolkit for text classification. 文本分类，LR，Xgboost，TextCNN，FastText，TextRNN，B...

28 Apr 2017 482

KorQuAD-beginner

Guide KorQuAD upload to leaderboard (EM 68.947 / F1 88.468) model which only use BERT-multilingua...

26 Apr 2019 41

classeval

Evaluation of supervised predictions for two-class and multi-class classifiers

11 Mar 2020 7

turkish-bert

Turkish BERT/DistilBERT, ELECTRA and ConvBERT models

02 Feb 2020 484

sahi

Framework agnostic sliced/tiled inference + interactive ui + error analysis plots

30 Jan 2021 3,585

hmBench

hmBench: Fine-Tuning, Evaluating & Benchmarking of Historic Language Models on NER Datasets

05 Oct 2023 4

europeana-bert

BERT and ELECTRA models trained on Europeana Newspapers

10 Feb 2020 30

CodeAssist

CodeAssist is an advanced code completion tool that provides high-quality code completions for Py...

09 Feb 2022 54

Tencent2020_Rank1st

The code for 2020 Tencent College Algorithm Contest, and the online result ranks 1st.

22 Jul 2020 1,023

bert4keras

keras implement of transformers for humans

26 Aug 2019 5,363

Object-and-facial-detection-in-python

This repo contains, training material, dlib implementation, tensorflow implementation and an own ...

21 Feb 2018 16

BERT-BiLSTM-CRF-NER

Tensorflow solution of NER task Using BiLSTM-CRF model with Google BERT Fine-tuning And private S...

25 Nov 2018 4,692

ChatLM-mini-Chinese

中文对话0.2B小模型（ChatLM-Chinese-0.2B），开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sf...

27 Aug 2023 1,166

Mental_Health_Analysis

This is project that helps detect user's mental health based on user's description.

24 Aug 2024 0

refinery-python-sdk

Official Python SDK for Kern AI refinery.

06 Jun 2021 18