युनिकोड दोन एन्कोडिंग फॉर्म वापरतो: 8-बिट आणि 16-बिट, एन्कोड केल्या जात असलेल्या डेटाच्या डेटा प्रकारावर आधारित. डीफॉल्ट एन्कोडिंग फॉर्म 16-बिट आहे, जेथे प्रत्येक वर्ण 16 बिट (2 बाइट) रुंद आहे . सोळा-बिट एन्कोडिंग फॉर्म सहसा U+hhhh म्हणून दर्शविला जातो, जेथे hhhh वर्णाचा हेक्साडेसिमल कोड पॉइंट आहे.